O'REILLY’ 


























Think Python: How to Think Like a Computer Scientist, 


Second Edition 


a 





[2] Allen B. Downey 3 
赵普 明 译 


py tacie g 大 民 闻 电 出 版 村 


O’Reilly Media，Inc. 介 绍 


1.1 什么 是 程 

1.2 运行 Python 

1.3 第 一 个 程 

1.4 算术 操作 符 

1.5 0 类 型 

1.6 形式 语言 和 自然 语言 
1.7 调试 

1.8 术语 

1.9 练习 

第 2 瘟 De, IAT AIBA 
Z 赋值 语 H] 


2.2 变量 名 称 


2.3 表达 式 和 语句 
2.4 脚本 模式 





















































版 权 信息 


PR: 像 计 算 机 科学 家 一 样 思考 Python (第 2 版 ) 


ISBN: 978-7-115-42551-5 





本 书 由 人 民 邮 电 出 版 社 发 行 数 字 版 。 版 权 所 有 ， 侵 权 必 冤 。 





您 购买 的 人 民 邮 电 出 版 社 电子 书 仅 供 您 个 人 使 用 ， 未 经 授权 ， 不 得 以 任 
何方 式 复制 和 传播 本 书 内 容 。 








我 们 愿意 相信 读者 具有 这 样 的 恨 知 和 觉悟， 与 我 们 共同 保护 知识 产权 。 











如 果 购 买 者 有 侵权 行为 ， 我 们 可 能 对 该 用 户 实施 包括 但 不 限于 关闭 该 帐 
号 等 维权 措施 ， 并 可 能 退 究 法 律 责任 。 





i [Æ] Allen B. Downey 


责任 编辑 杨 海 玲 
人 民 邮 电 出 版 社 出 版 发 行 ”北京 市 丰台 区 成 寿 竺 路 11 号 


邮编 100164 ”电子 邮件 315@ptpress.com.cn 


网 址 http://www.ptpress.com.cn 
。 读者 服务 热线 : (010)81055410 


反 盗 版 热线 : (010)81055315 


版 权 声 明 


Copyright ©2016 by O’Reilly Media, Inc. 


Simplified Chinese Edition, jointly published by O’Reilly Media, Inc. 
and Posts & Telecom Press, 2016. Authorized translation of the English 
edition, 2016 O’ Reilly Media, Inc., the owner of all rights to publish and sell 
the same. All rights reserved including the rights of reproduction in whole or 


in part in any form. 


本 书 中 文 简 体 版 由 O?Reilly Media,Inc. 授 权 人 民 邮 电 出 版 社 出 版 。 
未 经 出 版 者 书面 许可 ， 对 本 书 的 任何 部 分 不 得 以 任何 方式 复制 或 抄 


Re 





ALATA, ADD FE 


内 容 所 要 


本 书 以 塔 养 读者 以 计算 机 科学 家 一 样 的 思维 方式 来 理解 Python 语言 
编程 。 贯 穿 全 书 的 主体 是 如 何 思考 、 设 计 、 开 发 的 方法 ， 而 有 具体 的 编程 
语言 ， 只 是 提供 了 一 个 具体 场景 方便 介绍 的 媒介 。 


全 书 共 21 章 ， 详 细 介绍 Python 语言 编程 的 方方面面 。 本 书 从 最 基本 
的 编程 概念 开始 讲 起 ， 包 括 语言 的 语法 和 语义 ， 而 且 每 个 编程 概念 都 有 
清晰 的 定义 ， 引 领 读者 循序 渐进 地 学 习 变量 、 表 达 式 、 语 句 、 函 数 和 数 
据 结 构 。 书 中 还 探讨 了 如 何 处 理 文件 和 数据 库 ， 如 何 理解 对 象 、 方 法 和 
面 癌 对 象 编 程 ， 如 何 使 用 调试 技巧 来 修正 语法 错误 、 运 行 时 错误 和 语义 
错误 。 每 一 章 都 配 有 术语 表 和 练习 题 ， 方 便 读 者 巩固 所 学 的 知识 和 技 
巧 。 此 外 ， 每 一 章 都 抽出 一 节 来 讲解 如 何 调试 程序 。 作 者 针对 每 章 所 专 
注 的 语言 特性 ， 或 者 相关 的 开发 问 题 ， 总 结 了 调试 的 方方面面 。 











本 书 的 第 2 版 与 第 1 版 相 比 ， 做 了 很 多 更 新 ， 将 编程 语言 从 Python 2 
升级 成 Python 3， 并 修改 了 很 多 示例 和 练习 ， 增 加 了 新 的 章节 ， 更 全 面 


地 介绍 Python 语言 。 


这 是 一 本 实用 的 学 习 指 南 ， 适 合 没 有 Python 编程 经 验 的 程序 员 阅 
读 ， 也 适合 高 中 或 大 学 的 学 生 、Python 爱 好 者 及 需要 了 解 编程 基础 的 人 
阅读 。 对 于 第 一 次 接触 程序 设计 的 人 来 说 ， 是 一 本 不 可 多 得 的 佳作 。 
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O’Reilly Media 通 过 图 书 、 杂 志 、 在 线 服务 、 调 查 研究 和 会 议 等 方 
式 传播 创新 知识 。 自 1978 年 开始 ，O’Reilly 一 直 都 是 前 沿 发 展 的 见证 者 
和 推动 者 。 超 级 极 客 们 正在 开创 着 未 来 ， 而 我 们 关注 真正 重要 的 技术 趋 
势 一 一 通过 放大 那些 “细微 的 信号 ?来 刺激 社会 对 新 科技 的 应 用 。 作 为 技 
术 社 区 中 活跃 的 参与 者 ，O’Reilly 的 发 展 充满 了 对 创新 的 倡导 、 创 造 和 
发 扬 光 大 。 











O’Reilly 为 软件 开发 人 员 带 来 革命 性 的 “动物 书 ”， 创建 第 一 个 商业 
网 站 (GNN) ; 组 织 了 影响 深远 的 开放 源 代码 峰会 ， 以 至 于 开源 软件 运 
动 以 此 命名 ; 创 并 了 Make 灯 志 ， 从 而 成 为 DIY 革 命 的 主要 先锋 ， 公 司 一 
如 既往 地 通过 多 种 形式 缔结 信息 与 人 的 纽 市 。O’Reilly 的 会 议和 峰会 集 
聚 了 众多 超级 极 客 和 高 瞻 远 瞩 的 商业 领袖 ， 共 同 描绘 出 开创 新 产业 的 革 
命 性 思想 。 作 为 技术 人 士 获取 信息 的 选择 ，O'Reilly 现 在 还 将 先锋 专家 
的 知识 传递 给 普通 的 计算 机 用 户 。 无 论 是 通过 书籍 出 版 ， 在 线 服 务 或 者 

















面授 课程 ， 每 一 项 O'Reilly 的 产品 都 反映 了 公司 不 可 动摇 的 理念 一 一 信 
息 是 激发 创新 的 力量 。 
业界 评论 
“O’Reilly Radar ZA O ERR. ” 
Wired 





“O"Reilly 凭 借 一 系列 《真希 望 当 初 我 也 想到 了 ) 非凡 想法 建立 了 数 


百 万 美元 的 业务 。” 


Business 2.0 





“O’Reilly Conference 是 聚集 关键 思想 领袖 的 绝对 典范 
—CRN 
“一 本 O?Reilly 的 书 就 代表 一 个 有 用 、 有 前 途 、 需 要 学 习 的 主题 。” 


Irish Times 











“Tim 是 位 特 立 独行 的 商人 ， 他 不 光 放 眼 于 最 长 远 、 最 广阔 的 视野 并 
且 切 实地 按照 Yogi Berra 的 建议 去 做 了 :“ 如 果 你 在 路 上 遇 到 岔路 口 ， 走 
ek CAR) 。 回顾 过 去 Tim 似 乎 每 一 次 都 选择 了 小 路 ， 而 且 有 几 次 都 
是 一 内 即 逝 的 机 会 ， 尽 管 大 路 也 不 错 。?” 
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本 书 的 奇特 历史 


1999 年 ， 我 正在 为 一 门 Java 的 编程 入 门 诬 程 备课 。 这 门 课 我 已 经 教 
过 3 个 学 期 ， 感 到 有 些 灰 心 。 谍 程 的 不 及 格 率 太 高 ， 即 使 是 那些 及 格 的 
学 生 ， 也 只 获得 了 很 低 的 成 就。 





我 发 现 问题 之 一 是 教材 。 它 们 太 厚 ， 有 太 多 见 余 的 细节 ， 而 针对 编 
程 撤 巧 的 高 阶 的 指导 却 很 不 足 。 而 且 学 生 们 都 有 “陷阱 效应 ”的 知 恼 : 开 
头 时 很 容易 ， 也 能 循序 渐进 ， 但 接着 在 第 5 章 左 右 ， 整 个 地 板 束 突然 陷 
沙 了 。 新 内 容 来 得 太 多 、 太 快 ， 以 至 于 我 必须 花费 一 学 期 剩 下 的 全 部 时 
间 来 帮助 他 们 拾 回 丢失 的 片段 。 














开课 前 两 周 ， 我 决定 自己 来 编写 教材 。 我 的 目标 有 以 下 几 个 。 


。 尽量 简短 。 学 生 读 10 页 书 ， 比 不 读 50 页 书 要 好 。 

。 注意 词汇 。 我 尝试 尽量 少 用 术语 ， 并 在 第 一 次 使 用 它们 时 做 好 定 
Ka 

。 循序 渐进 。 为 了 避免 陷阱 效应 ， 我 抽出 了 最 困难 的 课题 ， 并 把 它们 
划分 成 更 细 的 学 习 步 又 。 

。 专注 于 编程 ， 而 不 是 编程 语言 。 我 只 注意 包涵 了 Java 的 最 小 的 可 用 
子 集 ， 而 忽略 掉 其 他 。 








我 需要 一 个 标题 ， 所 以 心血 来 潮 选 择 了 “How to Think Like a 


Computer Scientist”. 


第 工 版 教材 很 粗糙 ， 但 确实 有 效 。 学 生 们 读 完 读本 ， 亿 得 了 足够 的 
基础 知识 ， 以 至 我 其 至 可 以 利用 课 共 时 间 和 他 们 一 起 讨论 更 难 、 更 有 趣 
的 话题 ， 并 且 《 最 重要 的 是 ) 可 以 让 学 生 们 有 足够 的 时 间 在 课堂 上 做 练 
Je 





我 将 这 本 书 按照 GNU 目 由 文档 许可 协议 (GNU Free Documentation 
License) 发 布 ， 让 用 户 可 以 复制 、 修 改 和 分 发 本 书 。 


接 下 来 发 生 了 最 酪 的 事情 。Jeff Elkner， 弗 吉 尼 亚 州 的 一 位 高 中 老 
师 ， 使 用 了 我 的 书 ， 并 且 将 其 翻译 成 Python 语言 的 版 本 。 他 寄 给 我 他 的 
翻译 副本 ， 于 是 我 有 了 一 次 很 奇特 的 经 历 一 一 通过 读 我 自己 的 书 来 学 习 
Python。 通 过 绿茶 出 版 社 (Green Tea Press) ， 在 2001 年 我 出 版 了 第 一 
个 Python 版 本 。 


2003 年 ， 我 开始 在 欧 林 学 院 (Olin College) 教学 ， 并 第 一 次 需要 教 
授 Python 语 言 。 和 Java 的 对 比 非常 惊人 。 学 生 们 困扰 更 少 ， 学 会 得 更 
多 ， 从 事 更 有 意思 的 项 目 ， 总 的 来 说 得 到 了 更 多 的 乐趣 。 








在 那 之 后 我 一 直 继 续 拓 展 这 本 书 的 内 容 ， 修 改 错误 ， 改 进 示例 ， 并 
增加 新 的 材料 、 尤 其 是 练习 。 


结果 束 产 生 了 本 书 ， 并 改 用 了 不 那么 宏伟 党 蛙 的 书 名 一 一 Think 
Python 。 部 分 改动 如 下 所 述 





。 我 在 每 章 的 结尾 添加 了 一 节 关 于 调试 的 说 明 。 这 些 章节 描述 寻找 和 
避免 bug 的 通用 技巧 ， 并 警示 Python 中 容易 出 错 的 误区 。 


。 我 增加 了 更 多 的 练习 ， 小 到 简短 的 理解 性 测试 ， 大 到 几 个 实际 工 
程 。 大 部 分 练习 都 附带 了 链接 ， 可 以 查看 我 的 解答 。 

我 添加 了 一 系列 采 例 研究 一 一 较 长 的 示例 ， 包 括 练 习 、 解 答 以 及 讨 
论 。 

我 扩展 了 关于 程序 开发 计划 和 基础 设计 模式 的 讨论 。 

我 增加 了 关于 调试 和 算法 分 析 的 音节。 





第 2 版 增加 了 如 下 几 个 新 特性 。 


全 书 内 容 和 辅助 代码 都 更 新 到 Python 3。 


增加 了 几 节 ， 以 及 更 多 关于 Web 的 细节 ， 以 帮助 初学 者 通过 浏览 器 
就 能 开始 运行 Python， 而 不 需要 过 早 地 面 对 安 装 Python 的 问题 。 





对 于 第 4 章 的 “turtle 模块 >， 我 把 实现 从 以 前 自己 开发 的 Swampy 
乌龟 绘 网 包 ， 改 为 使 用 更 标准 的 Python 模块 turtle ， 它 更 容易 安 
装 ， 功 能 也 更 强大 。 

增加 了 新 的 一 章 “Python 拾 珍 ”〈 第 19 章 ) ， 介 绍 Python 提供 的 一 些 
并 不 必需 ， 但 有 时 会 很 方便 的 特性 。 


我 希望 你 喜欢 这 本 书 ， 并 希望 它 至 少 能 提供 一 点 帮助 ， 助 你 学 会 像 
计算 机 科学 家 那样 编程 和 思考 。 


— Allen B. Downey 


欧 林 学 院 


本 书 排版 约定 
本 书 使 用 下 列 排版 约定 。 
。 中文 楷体 (英文 斜体 ) : 用 于 新 术语 、 文 件 名 和 文件 扩展 名 。 
。 黑体 字 : 表示 术语 表 中 定义 的 词汇 。 
等 宽 字 体 (constant width) : 用 于 程序 清单 ， 以 及 段落 中 间 的 
代码 元 素 ， 如 变量 、 函 数 名 、 数 据 库 、 数 据 类 型 、 环 境 变 量 、 语 句 


。 加 粗 等 宕 字体 (constant with bold) : 表示 命令 或 其 他 应 当 
由 用 户 键入 的 文本 。 


。 等 宽 斜 体 字 ( constant width ) : 用 于 显示 需要 蔡 换 为 用 户 提 
供 的 值 或 由 环境 确定 的 值 的 文本 。 


代码 示例 的 使 用 


补充 材料 《代码 示例 、 练 习 等 ) 可 以 从 
http://www.greenteapress.com/thinkpython2/code 下 载 。 





本 书 的 目的 是 帮 你 完成 工作 。 一 般 来 说 ， 只 要 是 本 书 提供 的 示例 代 

， 你 都 可 以 用 在 自己 的 程序 和 文档 中 。 如 果 你 不 是 要 复制 大 部 分 的 代 
i 就 不 需要 联系 我 们 申请 授权 。 例 如 ， 写 一 个 程序 ， 里 面 使 用 了 本 书 
中 的 几 段 代码 ， 不 需要 申请 授权 。 但 销售 或 分 发 O'Reilly 书 籍 的 示例 光 
盘 则 需要 授权 。 回 答 问题 中 引用 本 书 内 容 或 示例 代码 ， 并 不 需要 申请 授 
权 ， 但 将 本 书 中 大 量 的 代码 引入 你 的 产品 文档 则 需要 授权 。 








在 引用 本 书 内 容 时 ， 我 们 并 不 强求 但 或 励 你 注 明 出 处 。 引 用 通常 包 
括 书 名 、 作 者 、 出 版 社 和 ISBN。 例 如 : “Think Python, 2nd Edition by 
Allen B. Downey (O’Reilly). Copyright 2016 Allen Downey, 978-1-4919- 
3936-9”. 





如 果 你 觉得 自己 对 本 书 代 码 示 例 的 使 用 超出 了 上 述 授权 范围 ， 可 以 
随时 联系 我 们 : permissions@oreilly.com。 


联系 我 们 
请 将 关于 本 书 的 评论 和 问题 发 给 出 版 商 。 
美国 : 
O’Reilly Media, Inc. 
1005 Gravenstein Highway North 
Sebastopol, CA 95472 


HA: 








北京 市 西城 区 西直门 南大 街 2 号 成 铬 大 厦 C 座 807 室 (100035) 





奥 羔 利 技术 咨询 (北京 ) 有 限 公 司 





我 们 为 本 书 提供 了 专门 的 网 页 ， 上 面 有 勘误 表 、 示 例 ， 以 及 其 他 额 
外 的 信息 ， 可 以 通过 http://bit.ly/think-python_2E 访 问 该 网 页 。 


如 果 想 对 本 书 进行 评论 或 想 问 技术 问题 ， 请 将 邮件 发 到 


bookquestions@oreilly.com. 


想 了 解 更 多 关于 我 们 的 书籍 、 课 程 、 会 议 ， 以 及 新 闻 等 信息 ， 请 登 
录 我 们 的 网 站 : http:/www.oreilly.com 。 


我 们 的 其 他 联系 方式 如 下 。 


Facebook: http://facebook.com/oreilly 
Twitter: http://twitter.com/oreillymedia 


YouTube: http://www. youtube.com/oreillymedia 
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在 最 近 几 年 中 ， 超 过 100 名 眼光 犀利 、 思 维 敏 捷 的 读者 给 我 寄 来 了 
建议 和 修订 。 他 们 对 这 个 项 目的 贡献 和 热情 ， 对 我 是 极 大 的 帮助 。 


如 果 你 有 建议 或 者 修订 意见 ， 请 发 邮件 到 
feedback@thinkpython.com。 如 条 我 根据 你 的 回馈 做 出 了 修改 ， 会 将 你 
加 入 贡献 者 列表 中 《除非 你 要 求 被 隐藏 ) 。 





如 果 你 给 出 错误 出 现 的 位 置 的 部 分 语句 ， 会 让 我 更 容易 搜索 。 页 码 
或 者 章节 编号 也 可 以 ， 但 并 不 那么 容易 处 理 。 谢 谢 ! 


Lloyd Hugh Allen 对 8.4 节 提出 m 

Yvon Boulianne 对 第 5 章 提出 了 一 错误 的 修订 建议 。 

Fred Bremmer 对 2.1 节 提出 了 o ə 

Jonah Cohen 编 号 了 Perl 脚 本 将 本 书 的 LaTeX 源 码 转 换 成 美丽 的 
HTML. 

Michael Conlon 提 出 了 第 2 章 的 一 个 语法 错误 ， 并 提出 第 1 章 的 格式 
改进 ， 并 且 他 开启 了 对 解释 器 的 技术 讨论 。 

Benoit Girard 寄 来 一 个 对 5.6 节 的 有 趣 的 修订 。 

Courtney Gleason 和 Katherine Smith 编写 了 horsebet .py ， 在 本 书 
的 早期 版 本 中 作为 一 个 案例 研究 。 他 们 的 程序 现在 可 以 在 网 站 上 找 
到 。 

Lee Harr 提 交 了 很 多 修订 建议 ， 我 们 没有 空间 在 这 里 一 一 列 出 ， 并 
且 他 确实 应 当 被 列 为 本 书 的 一 位 主要 编辑 。 





James Kaylin 是 一 名 使 用 本 书 的 学 生 。 他 提交 了 许多 修订 。 

David Kershaw 修正 了 3.10 节 中 错误 的 catTwice 函数 。 

Eddie Lam 提 出 了 第 1 章 、 第 2 人 章 和 第 3 章 的 很 多 修订 建议 ， 他 也 修正 
了 Makefie， 这 样 第 一 次 运行 时 会 自动 建立 索引 。 他 也 帮助 我 们 设 
置 了 一 个 版 本 管理 方案 。 

Man-Yong Lee 寄 来 了 对 2.4 节 中 的 示例 代码 的 修订 。 

David Mayo 指 出 第 1 章 中 的 单词 “unconsciously” 需 要 被 修改 

为 “subconsciously”。 

Chris McAloon 寄 来 了 对 3.9 节 和 3.10 节 的 一 些 修订 。 

Matthew J. Moelter 是 本 书 的 长 期 贡献 者 ， 提 出 了 很 多 修订 建议 。 
Simon Dicon Montford 报 告 了 第 3 章 中 缺失 的 函数 定义 以 及 几 个 错 别 
字 。 他 也 发 现 了 第 13 章 中 的 increment 函数 的 错误 。 

John Ouzts 修正 了 第 3 章 中 “返回 值 ? 的 定义 。 

Kevin Parks 对 关于 本 书 如 何 分 布 提出 了 有 价值 的 评论 和 建议 。 
David Pool 发 来 了 第 1 章 中 术语 表 中 的 错别字 ， 以 及 鼓励 的 赞美 之 


Michael Schmitt 寄 来 了 关于 文件 和 和 异常 的 章 市 的 修订 建议 。 

Robin Shaw 指 出 了 13.1 市 中 的 一 个 错误 ，printTime 浮 数 在 一 个 示例 
中 没有 定义 就 使 用 了 。 

Paul Sleigh 在 第 7 章 中 找到 一 个 错误 ， 并 发 现 了 Jonah Cohen FÆ 
成 HTML 的 Perl 脚 本 的 bug。 

Craig T. Snydal 在 德 鲁 大 学 (Drew University) 的 一 门 课 上 试验 这 个 
课本 ,他 提出 了 好 几 个 有 价值 的 建议 和 修订 。 

Ian Thomas 和 他 的 学 生 们 使 用 这 本 书 作为 编程 课程 的 教材 。 他 们 第 
一 个 尝试 使 用 本 书后 半 部 分 的 章节 ， 并 且 提 出 了 许多 勘误 和 建议 。 




















Keith Verheyden 发 来 了 第 3 章 的 一 个 修正 。 

Peter Winstanley 让 我 们 知道 了 第 3 章 的 拉丁 文中 一 个 长 期 存在 的 错 
误 。 

Chris Wrobel 修 正 了 文件 O 和 异常 一 章 的 代码 错误 。 

Moshe Zadka 对 本 书 有 不 可 估量 的 贡献 。 他 编号 了 关于 字典 的 一 章 
的 第 1 版 草稿 ， 并 在 本 书 的 早期 阶段 持续 提供 指导 。 

Christoph Zwerschke 发 来 了 几 个 勘误 和 教学 法 的 建议 ， 并 解释 了 
gleich 和 selbe 的 区 别 。 

James Mayer 发 送 给 我 们 非常 多 的 拼写 错误 ， 包 括 贡 献 者 列表 中 的 
两 个 错误 。 

Hayden McAfee 发 现 了 两 个 示例 之 间 潜 在 的 冲突 。 

Angel Arnal 是 翻译 本 书 的 西班牙 语 版 本 的 国际 团队 的 一 员 。 他 也 发 
现 了 英文 版 中 的 几 个 错误 。 

Tauhidul Hoque 和 Lex Berezhny 创 建 了 第 1 章 中 的 图 表 ， 并 改进 了 很 
多 其 他 图 表 。 

Dr. Michele Alzetta 发 现 了 第 8 章 中 的 一 个 错误 ， 并 发 来 了 一 些 有 趣 
的 教学 法 评论 ， 以 及 关于 斐 波 那 旭 数 列 和 Old Maid 的 建议 。 

Andy Mitchell 友 现 了 第 1 章 中 的 一 个 录入 错误 ， 以 及 第 2 章 中 一 个 错 
误 的 示例 。 

Kalin Harvey 对 第 7 章 的 一 个 说 明 提供 了 建议 ， 并 发 现 了 几 个 录入 错 
误 。 

Christopher P. Smith 发 现 了 几 个 录入 错误 ， 并 帮助 我 们 更 新 本 书 到 
Python 2.2。 

David Hutchins 发 现 了 前 言 中 的 一 个 错别字 。 

Gregor Lingl 在 奥地利 维也纳 的 一 个 高 中 教授 Python。 他 正在 翻译 本 











书 的 德 文 版 ， 并 发 现 了 第 5 章 中 的 几 个 错误 。 

Julie Peters 发 现 了 前 言 中 的 一 个 错别字 。 

Florin Oprina 发 来 一 个 makeTime 的 改进 ，printTime 的 一 个 修 
正 ， 以 及 发 现 的 一 个 重要 的 录入 错误 。 

D. J. Webre 对 第 3 章 的 一 个 说 明 提 出 了 建议 。 

Ken 在 第 8、9、11 意 中 发 现 了 好 几 个 错误 。 

Ivo Wever 在 第 5 章 发 现 一 个 录入 错误 ， 并 对 第 3 章 中 的 一 个 说 明 提 
出 了 建议 。 

Curtis Yanko 对 第 2 章 中 的 一 个 摘 述 提出 了 建议 。 

Ben Logan 发 来 许多 发 现 的 录入 错误 ， 并 发 现 了 翻译 HTML 的 问 
题 。 

Jason Armstrong 发 现 了 第 2 章 中 一 个 漏 掉 的 词 。 

Louis Cordier 发 现 了 第 16 昔 中 有 一 个 代码 和 文本 不 一 致 的 地 方 。 
Brian Cain 在 第 2 章 和 第 3 章 中 提出 了 几 个 质 述 的 改进 建议 。 

Rob Black 发 来 了 许多 勘误 ， 包 括 一 些 针 对 Python 2.2 的 修改 。 
巴黎 中 央 理 工大 学 的 Jean-Philippe Rey 发 来 了 一 些 补 本 ， 包 括 对 
Python 2.2 的 更 新 ， 以 及 其 他 一 些 细心 的 改进 。 

乔治 华盛顿 大 学 的 Jason Mader 提 供 了 许多 有 用 的 建议 和 改正 。 

Jan Gundtofte-Bruun 提 醒 我 们 “a error” 应 改 为 “an error”。 

Abel David 和 Alexis Dinno 提醒 我 们 “matrix” 的 复数 形式 

是 “matrices” 而 不 是 “matrixes”。 这 个 错误 在 书 中 已 经 存在 了 多 年 ， 
但 两 个 姓名 以 同样 的 字母 开头 的 读者 同一 天 报告 了 它 。 真 的 很 奇 
PE, 
Charles Thayer K RAIRE — HB AZ aS, FERATA 
清 “ 形 参 ”" 和 “ 实 参 ”的 使 用 。 








Roger Sperberg 指 出 了 第 3 章 的 一 个 逻辑 错误 。 

Sam Bul 指 出 了 第 2 章 中 一 段 令 人 困惑 的 描述 。 

Andrew Cheung 指 出 了 两 处 “定义 前 先 使 用 ”的 错误 。 

C.Corey Capel 发 现 缺 了 单词 ， 以 及 第 4 章 的 一 个 录入 错误 。 

Alessandra 帮助 我 们 理 清 了 一 些 关 于 Turtle 的 困惑 。 

Wim Champagne 在 字典 示例 中 发 现 一 个 错误 。 

Douglas Wright 在 弧度 计算 中 发 现 了 一 个 除法 同 下 取 整 的 错误 。 
Jared Spindor 发 现 了 一 处 句 尾 的 无 用 词 。 

Lin Peiheng 发 来 了 许多 很 有 用 的 建议 。 

Ray Hagtvedt 发 来 了 两 处 错误 和 一 处 不 是 那么 错 的 错误 。 

Torsten Hiibsch 指 出 Sawmpy 中 的 一 处 不 一 致 。 

Inga Petuhhov 修 正 了 第 14 章 中 的 一 个 示例 。 

Arne Babenhauserheide 发 来 了 几 个 有 用 的 勘误 。 

Mark E. Casida 非 常 善于 发 现 重 复 的 单词 。 

Scott Tyler 填 上 了 一 个 缺失 的 “that”， 并 发 来 了 一 堆 勤 误 。 

Gordon Shephard 必 来 了 几 个 勤 误 ， 每 个 都 用 单独 的 邮件 。 

Andrew Turmner 发 现 了 第 8 章 中 的 一 个 错误 。 

Adam Hobart 修 正 了 一 个 在 弧度 计算 中 除法 同 下 取 整 的 错误 。 

Daryl Hammond 和 Sarah Zimmerman 指 出 我 过 早 提 出 了 math.pi 。 

并 且 Zim 发 现 了 一 个 录入 错误 。 

George Sass 在 调试 章节 中 发 现 了 一 个 bug。 

Brian Bingham 建 议 了 练习 11-10。 

Leah Engelbert-Fenton 指 出 我 用 tuple 作为 变量 名 称 ， 这 恰恰 违反 
了 我 自己 的 建议 。 然 后 他 发 现 了 一 堆 录 入 错误 以 及 一 个 “定义 前 先 

(a 











Joe Funke 发 现 了 一 个 录入 错误 。 

Chao-chao Chen 在 非 波 那 契 示 例 中 发 现 了 一 个 不 一 致 处 。 

Jeff Paine 知 道 space 和 spam 的 区 别 。 

Lubos Pintes 发 来 一 个 录入 错误 。 

Gregg Lind 和 Abigail Heithoff 建 议 了 练习 14-4。 

Max Hailperin 发 来 了 许多 勘误 和 建议 。Max 是 非 几 的 Concrete 
Abstractions (Course Technology, 1998) 一 书 的 作者 之 一 。 在 读 完 
本 书 之 后 你 可 能 会 想 要 读 那 本 书 。 

Chotipat Pornavalai 在 一 个 错误 信息 中 发 现 了 一 个 错误 。 

Stanislaw Antol 寄 来 了 一 个 很 有 用 的 建议 列表 。 

Eric Pashman 对 第 4 章 到 第 11 章 发 来 了 许多 勘误 。 

Miguel Azevedo 发 现 了 一 些 录入 错误 。 

Jianhua Liu 发 来 了 一 长 列 勘 误 。 

Nick King 发 现 了 一 个 缺失 单词 。 

Martin Zuther 发 来 了 一 长 列 建议 。 

Adam Zimmerman 发 现 了 我 举例 的 一 个 “实例 ?中 的 不 一 致 处 ， 以 及 
其 他 一 些 错 误 。 

Ratnakar Tiwari 建 议 加 一 个 脚注 说 明 什 么 是 “退化 ”三 角形 。 

Anurag Goel 提 出 了 is_abecedarian 的 另 一 个 解答 ， 并 发 来 其 他 一 
些 勘误 。 他 还 知道 如 何 拼写 Jane Austen. 

Kelli Kratzer 发 现 了 一 个 录入 错误 。 

Mark Griffiths 指 出 了 第 3 章 中 的 一 个 令 人 困惑 的 示例 。 

Roydan Ongie 发 现 了 我 的 牛顿 方法 的 一 个 错误 。 

Patryk Wolowiec 帮 我 解决 了 一 个 HTML 版 本 的 问题 。 

Mark Chonofsky 告 诉 我 Python 3 中 的 新 关键 字 。 




















Russell Coleman 帮 我 修正 了 几何 错误 。 

Wei Huang 发 现 了 几 处 录入 错误 。 

Karen Barber 发 现 了 本 书 中 最 古老 的 录入 错误 。 

Nam Nguyen 发 现 了 一 个 录入 错误 ， 并 指出 我 使 用 了 装饰 器 模式 但 
并 没有 用 它 的 名 字 。 

Stéphane Morin 发 来 了 一 些 建 议和 勘误 。 

Paul Stoop 修 改 了 一 个 uses_only 中 的 录入 错误 。 

Eric Bronner 指 出 了 关于 操作 符 顺 序 的 讨论 中 的 一 个 困惑 之 处 。 
Alexandros Gezerlis 提 交 的 建议 的 数量 和 质量 都 设置 了 一 个 新 的 标 
准 。 我 们 非常 感谢 他 ! 

Gray Thomas 知 道 哪 边 是 左 哪 边 是 右 。 

Giovanni Escobar Sosa 发 来 一 长 列 的 勘误 和 建议 。 

Alix Etienne 修 正 了 一 个 URL。 

Kuang He 发 现 一 个 录入 错误 。 

Daniel Neilson 修 正 了 一 个 关于 操作 符 顺 序 的 错误 。 

Will McGinnis 指 出 polyline 在 两 个 地 方 定义 的 不 同 。 

Swarup Sahoo 发 现 了 一 个 缺失 的 分 号 。 

Frank Hecker 指 出 一 个 练习 不 细致， 并 发 现 了 几 个 坏 链 接 。 
Animesh B 帮 助 我 清理 了 一 个 令 人 困惑 的 示例 。 

Martin Caspersen 发 现 了 两 处 取 整 错误 。 

Gregor Ulm 发 来 一 些 勘 误 和 建议 。 

Dimitrios Tsirigkas 建 议 我 更 清晰 地 描述 一 个 练习 。 

Carlos Tafur 发 送 了 一 整 页 勘误 和 建议 。 

Martin Nordsletten 在 一 个 练习 解答 中 找到 了 一 个 bug。 

Lars O. D. Christensen 找 到 了 一 个 失效 的 引用 。 








Victor Simeone 找到 了 一 个 录入 错误 。 

Sven Hoexter 指 出 一 个 叫 作 input WR EA A m S AARAA 

Viet Le 找到 了 一 个 录入 错误 。 

Stephen Gregory 指 出 Python 3 中 cmp 的 问题 。 

Matthew Shultz 告 知 我 一 个 失效 链接 。 

Lokesh Kumar Makani 告 知 我 几 个 失效 链接 ， 以 及 出 错 消息 的 改 

AS 

Ishwar Bhat 修 正 了 我 对 费 马 大 定理 的 描述 

Brian McGhie 建 议 了 一 个 更 清晰 的 阐述 

Andrea Zanella 将 本 书 翻译 成 意大利 语 ， 并 发 送 了 一 些 勘 误 。 

非常 感谢 Melissa Lewis 和 Luciano Ramalho 出 色 的 评论 ， 以 及 对 本 书 
第 2 版 的 建议 。 

感谢 PythonAnywhere 的 Harry Percival 帮 助人 们 在 浏览 器 中 运行 
Python 。 

Xavier Van Aubel 对 第 2 版 做 出 了 几 个 有 用 的 修正 。 


本 书 的 目标 是 教会 你 像 计 算 机 科学 家 一 样品 考 。 这 种 思考 方式 综合 
了 数学 、 工 程 学 以 及 上 自然 科学 的 一 些 最 优秀 的 特性 。 计 算 机 科学 家 与 数 
学 家 类 似 ， 他 们 使 用 形式 语言 来 描述 理念 〈 特 别 是 计算 ) ;与 工程 师 类 
似 ， 他 们 设计 产品 ， 将 元 件 组 闭 成 系统 ， 对 不 同 的 方案 进行 评 佑 选择; 
与 自然 科学 家 类 似 ， 他 们 观察 复杂 系统 的 行为 ， 构 建 科学 假说 ， 并 检验 
其 预测 。 


作为 计算 机 科学 家 ， 节 重要 的 技能 驶 是 问题 求解 。 问 题 求 解 是 发 
现 问题 、 创 造 性 地 思考 解决 方案 以 及 清晰 准确 地 表达 解决 方 采 的 能 
实践 证 明 ， 学 习 编 程 的 过 程 ， 正 是 训练 问题 求解 能 力 的 绝 佳 机 会 。 这 也 
是 本 章 标题 用 “程序 之 道 ” 的 原因 。 





一 方面 ， 你 将 学 会 编程 ， 其 本 身 就 是 一 个 非常 有 用 的 技能 ， 另 一 方 
面 ， 你 可 以 使 用 编程 作为 工具 ， 去 达到 更 高 的 目标 。 随 着 本 书 的 深入 ， 
那个 目标 会 逐渐 明晰 。 
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程序 是 指 一 组 定义 如 何 进 行 计 算 的 指令 的 集合 。 这 种 计算 可 能 是 
数学 计算 ， 如 解 方程 组 或 者 得 找 多 项 式 的 根 ， 也 可 以 是 符号 运算 ， 如 搜 
索 和 蔡 换 文档 中 的 文本 ， 或 者 图 形 相 关 的 操作 ， 如 处 理 图 像 或 播放 视 
频 。 





在 不 同 的 编程 语言 中 ， 程 序 的 细节 有 所 不 同 ， 但 儿 乎 所 有 编程 语言 
中 都 会 出 现 以 下 几 类 基本 指令 。 





。 输入: 从 键盘 、 文 件 或 者 其 他 设备 中 获取 数据 。 

。 输出 : 将 数据 显示 到 屏幕 ， 保 存 到 文件 中 ， 或 者 发 送 到 网 络 上 
等 。 

。 数学 : 进行 基本 数学 操作 ， 如 加 法 或 乘法 。 

条 件 执行 检 碍 茶 种 条 件 的 状态 ， 并 执行 相应 的 代码 。 

HR: 重复 执行 茶 种 动作 ， 往 往 在 重复 中 有 一 些 变 化 。 




















信 不 信 由 你 ， 这 兰 不 多 就 是 全 部 了 。 你 所 遇 到 过 的 所 有 程序 ， 无 论 
多 么 复业 ， 孝 是 由 类 似 上 面 的 这 些 指令 组 成 的 。 所 以 我 们 可 以 把 编程 看 
作 一 个 将 大 而 复杂 的 任务 分 解 为 更 小 的 子 任务 的 过 程 ， 不 断 分 解 ， 直 到 
任务 简单 到 足以 由 上 面 的 这 些 基 本 指令 组 合 完成 。 


1.2 ”运行 Python 





Python 入 门 的 挑战 之 一 在 于 你 可 能 需要 自己 在 电脑 上 安装 Python 及 
相关 软件 。 如 果 你 熟悉 目 己 的 操作 系统 ， 而 且 习惯 于 命令 行 界面 ， 那 么 
安 闭 Python 不 是 什么 问题 。 但 对 于 初学 者 来 说 ， 同 时 学 习 编 程 和 系统 管 
理 命令 两 件 事 ， 有 时 候 是 非常 痛 知 的 。 














为 了 避免 这 个 问题 ， 我 推荐 你 开始 先 在 浏览 器 中 运行 Python， 等 熟 
悉 了 Python 语言 之 后 ， 我 再 同 你 介绍 如 何在 电脑 上 安装 Python。 





用 于 运行 Python 的 网 站 有 不 少 。 如 果 你 已 经 找到 一 个 喜欢 的 ， 就 可 
以 直接 去 用 。 如 果 没 有 ， 我 推荐 PythonAnywhere。 我 在 
http://tinyurl.com/thinkpython2e 上 提供 了 详细 的 入 门 指 导 。 


有 两 个 版 本 的 Python， 分 别 为 Python 2 和 Python 3。 它 们 很 类 似 ， 所 
以 如 果 你 学 会 了 一 个 版 本 ， 也 能 很 容易 地 切换 到 男 一 个 版 本 。 实 际 上 ， 
作为 初学 者 ， 你 会 遇 到 的 两 者 之 间 的 区 别 非 常 少 。 本 书 是 针对 Python 3 
编写 的 ， 但 我 也 会 给 出 一 些 关 于 Python 2 的 注意 事项 。 


Python 解释 器 是 一 个 读 取 并 执行 Python 代码 的 程序 。 根 据 所 在 环境 
的 不 同 ， 你 可 能 需要 点 击 程序 图 标 ， 或 者 在 命令 行 中 键入 python 命令 
来 启动 解释 右 。 当 它 启 动 以 后 ， 可 以 看 到 如 下 输出 : 





Python 3.4.0 (default, Jun 19 2015, 14:20:21) 
[GCC 4.8.2] on linux 
Type "help", "copyright", "credits" or "license" for more information. 


>>> 





前 3 行文 本 包含 了 解释 器 和 所 运行 的 操作 系统 的 信息 ， 所 以 可 能 与 
你 看 到 的 有 些 区 别 。 但 你 应 当 检 查 版 本 号 是 否 以 3 开头 《本 例 所 示 的 
是 3.4.6 ) ， 表 示 你 使 用 的 是 Python 3 的 解释 器 。 如 果 版 本 号 以 2 开头 ， 
那么 (你 肯定 猜 到 了 )〉 解释 器 是 Python 2. 








最 后 一 行 是 一 个 提示 符 ， 表 明 解 释 器 已 经 准备 好 ， 等 待 你 键入 代 
码 。 如 果 你 键入 一 行 代 码 并 按 下 Enter 键 ， 解 释 需 会 显示 结 采 : 


>>> 1+1 
2 


| | ie 


依照 传统 ， 用 新 语言 编写 的 第 一 个 程序 叫 “Hello, World!'”， 因 为 这 
个 程序 所 做 的 事情 就 是 只 显示 “Hello, World!”。 在 Python 中 ， 它 是 这 个 











>>> print('Hello, World!') 


7 
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这 是 print 语句 的 一 个 示例 。print 并 不 会 真 往 纸 上 打 印 文 字 ， 
而 是 在 屏幕 上 显示 结果 。 在 这 个 例子 中 ， 输 出 的 结果 是 : 





Hello, World! 











程序 中 的 引号 表示 要 显示 的 文本 的 开始 和 结束 ， 在 输出 结果 中 它们 
并 不 显示 。 


括号 表示 print 是 一 个 函数 。 我 们 将 在 第 3 章 中 讨论 函数 。 


在 Python 2 中 ，print 语句 略 有 不 同 。 它 不 是 一 个 函数 ， 所 以 不 使 
Hiig: 


>>> print 'Hello, World!' 


这 个 区 别 的 意义 在 后 面 会 慢 慢 显现 ， 但 现在 只 需要 知晓 就 足够 了 。 








1.4 算术 操作 符 


绍 完 “Hello, World” 之 后 ， 接 下 来 是 算术 操作 。Python 提 供 了 操作 
从 ， eon SPEEA RAIA TT SEER TE A RATT So 


操作 符 +、- 和 *#* 分 别 表示 进行 加 法 、 减 法 和 乘法 运算 ， 如 下 面 示 例 
所 示 : 





操作 符 /表示 除法 运算 : 


>>> 84 / 2 
42.0 


这 里 你 可 能 会 奇怪 为 什么 结果 是 42.6 而 不 是 42 。 我 会 在 下 一 节 解 


最 后 ， 操 作 符 ** 表示 进行 指数 运算 。 也 就 是 次， 会 把 一 个 数 按 指 
数 进行 乘 方 : 


>>> 6**2 + 6 
42 








在 其 他 一 些 语言 中 ， 指 数 操作 用 ^ 符号 表示 ， 但 在 Python 中 ^ 这 个 
符号 已 经 用 来 表示 二 进 制 按 位 运算 XOR 了 。 如 果 你 不 熟悉 按 位 运算 ， 结 
果 可 能 会 让 你 感到 奇怪 : 


>>> 6 ^ 2 
4 


本 书 我 不 会 讨论 按 位 操作 符 ， 但 读者 可 以 在 
http://wiki.python.org/moin/BitwiseOperator 上 阅读 相关 文档 。 


15 值 和 类 型 





值 (value) 是 程序 操作 的 最 基本 的 东西 ， 如 一 个 字母 或 者 数字 。 
前 面 我 们 见 过 一 些 值 ， 如 2 、42.6 以 及 'Hello，Wor1d! ' 。 


这 些 值 属于 不 同 的 类 型 (type) : 2 是 整 型 (integer) WJ, 42.0 
是 浮 点 型 (floating-point) 的 ， 而 'Hello，Wor1d! ' 是 字符 串 
(string) 类 型 的 ， 这 么 称呼 是 因为 它 是 由 一 堆 字 母 “ 串 连 ?起 来 的 。 


如 果 不 确认 一 个 值 的 类 型 ,解释 占 可 以 告诉 你 : 


>>> type(2) 
<class 'int'> 
>>> type(42.0) 
<class 'float'> 


>>> type('Hello, World!') 
<type “Str > 








在 这 些 结果 中 ， 单 词 “class” (4) 被 用 于 菏 一 类 型 中 ， 这 是 一 种 值 


不 足 为 奇 ， 整 数 属于 "int' 类 型 , 字符 串 属 于 "str' 类 型 ， 而 浮 点 
数 属于 'float' 类 型 。 





那么 '2" 和 '42.6' 这 样 的 值 呢 ? 它们 看 起 来 像 是 数字 ， 但 又 使 用 
字符 串 第 用 的 引号 括 起 来 : 


>>> type('2') 
<type 'str'> 


>>> type('42.0') 
<type ‘str'> 





它们 是 字符 串 。 


当 输 入 一 个 很 大 的 数字 时 ， 你 可 能 会 妨 不 住 想 在 数字 中 间 加 上 去 
=, W1G1,000,000 这 样 。 在 Python 中 这 并 不 是 合法 的 整数 ， 但 它 凑巧 
又 是 一 个 合法 的 表达 式 : 


>>> 1,000,000 
(1, ©, @) 





当然 ， 这 和 我 们 预期 的 完全 不 同 ! Python 把 1,666,666 解释 成 一 个 
用 逗号 分 隔 的 整数 序列 。 关 于 这 种 序列 在 本 书后 面 可 以 学 到 更 多 内 容 。 


16 形式 语言 和 目 然 语言 


目 然 语言 是 指 和 人们 所 说 的 语言 ， 如 瑞 语 、 西 班 牙 语 和 法 语 。 它 们 
不 是 由 人 设计 而 来 的 (虽然 人 们 会 尝试 加 以 语法 限制 ) ， 而 是 自然 演化 
而 来 的 。 








形式 语言 则 是 人 们 为 了 特殊 用 途 设计 的 语言 。 例 如 ， 数 学 上 使 用 
的 符号 体系 是 一 种 特别 擅 于 表示 数字 和 符号 之 间 关 系 的 形式 语言 ， 化 学 
家 则 使 用 号 一 种 形式 语言 来 表示 分 子 的 化 学 结构 。 而 最 重要 的 是 : 











编程 语言 是 人 们 为 了 表达 计算 过 程 而 设计 出 来 的 形式 语言 。 


形式 语言 倾 则 于 对 语法 做 出 严格 的 限制 。 例 如 ，3 + 3 = 6 是 语法 正 
确 的 数学 表达 式 ， 但 3+ = 3$6 则 不 是 。H, O 是 语法 正确 的 化 学 方程 式 ， 
而 > Zz 则 不 是 。 





语法 规则 有 两 种 ， 分 别 适 用 于 记号 (token) 和 结构 (structure) 。 
记号 是 语言 的 基本 元 素 ， 如 词 、 数 字 和 化 学 元 素 。3+ = 3$6 的 一 个 问题 
就 是 $4 在 数学 表达 式 中 《至 少 就 我 所 知 ) 不 是 合法 记号 。 相 似 地 ，，Zz 不 
合法 是 因为 并 不 存在 缩写 为 Zz 的 化 学 元 素 。 








第 二 种 语法 规则 指定 记号 所 组 合 的 方式 。 数 学 等 式 3+ = 3 不 合法 ， 
因为 虽然 + 和 = 是 合法 记号 ， 但 不 能 将 它们 连续 放置 。 相 似 地 ， 在 化 学 表 
达 式 里 ， 下 标 数字 应 该 出 现在 元 素 名 称 之 后 ， 而 不 是 之 前 。 





“This is @ well-structured Engli$h sentence with invalid t*kens in it.” 
一 个 结构 民 好 ， 但 包含 非 法 记号 的 英语 语句 。 “This sentence all valid 





tokens has, but invalid structure with.” 这 人 句 话 所 有 的 记号 都 合法 ， 但 是 语 
句 结构 不 合法 。 


当 你 阅读 英语 的 句子 或 形式 语言 的 语句 时 ， 需 要 章 清 句子 的 结构 是 
什么 《虽然 在 目 然 语言 中 这 个 过 程 是 下 意识 完成 的 ) 。 这 个 过 程 称 为 语 
法 分 析 。 

















虽然 形 陈 语言 和 目 然 语言 有 很 多 共同 的 特点 一 记号、 结构 、 语 法 
以 及 语义 ， 但 它们 也 有 一 些 区 别 。 


eK ME: 自然 语言 充满 了 卜 义 ， 人 们 通过 上 下 文 线索 和 其 他 信息 
来 处 理 这些 歧 义 。 形 式 语 言 通常 设计 为 几乎 或 者 完全 没有 歧义 ， 即 
不 论 上 下 文 环境 如 何 ， 任 何 表 达 式 都 只 有 一 个 含义 。 

o 多 余 性 :为 了 弥补 歧义 ， 减少 误解 ， 目 然 语言 采用 大 量 的 见 余 。 
因此 ， 自 然 语 言 往 往 很 嗓 嗪 。 形 式 语 言 则 相对 不 那么 元 余 ， 更 加 简 
o 

。 FEE: 自然 语言 充满 了 习惯 用 语 和 比喻 。 例 如 ， 有 人 说 , “硬币 
掉 了 ”(The penny dropped!) ， 并 不 一 定 是 硬币 ， 也 不 一 定 是 有 
什么 掉 了 。 形 式 语 言 则 严格 按照 它 的 字面 意思 表达 含义 。 














因为 我 们 都 说 着 目 然 语 言 长 大 ， 有 时 候 很 难 适 应 形式 语言 。 在 菏 种 
意义 上 ， 形 式 语言 和 自然 语言 的 区 别 与 诗词 和 散文 的 区 别 类 似 ， 而 且 程 
度 更 甚 。 








。 诗词 : 字 词 的 使 用 ， 既 考虑 它们 的 音韵 ， 也 考 夸 到 它们 的 意义 ， 
而 整 首 许 合 起 来 表达 菏 种 意境 或 情绪 反应 。 牙 义 不 仅 常见 ， 而 且 御 
常 是 刻意 为 之 。 

















。 散文 : 字 词 的 意义 更 加 重要 ， 而 且 句子 的 结构 也 提供 更 多 的 意 
Mo BOC HR EA aT, (EVRA AZ IK 

。 程序 : 计算 机 程序 的 意义 不 含 歧义 ， 直 接 如 字面 所 指 。 完 全 可 以 
通过 它 的 记号 和 结构 理解 其 意义 。 





形式 语言 的 密度 远 远 大 于 目 然 语言 ， 所 以 阅读 起 来 需要 花费 更 多 的 
时 间 。 还 有 ， 结 构 非常 重要 ， 上 所 以 直接 自 顶 向 下 、 从 左 至 右 的 阅读 顺序 
并 不 一 定 是 最 好 的 。 相 反 ， 要 试 着 学 会 在 头脑 中 解析 程序 ， 辨 别 出 记 号 
并 解析 出 结构 。 最 后 ， 细 节 很 重要 。 在 自然 语言 中 常常 可 以 忽略 的 小 错 
误 ， 如 拼写 错误 或 者 标点 符号 错误 ， 在 形式 语言 中 往往 会 造成 很 大 的 和 
别 。 





1.7 调试 








程序 是 很 容易 出 错 的 。 因 为 茶 种 古怪 的 原因 ， 程 序 错误 被 称 为 bug 
， 而 查 捕 bug 的 过 程 称 为 调试 (debugging) 。 


一 个 程序 中 可 能 出 现 3 种 类 型 的 错误 : 语法 错误 、 运 行 时 错误 和 语 
义 错误 。 对 它们 加 以 区 分 ， 可 以 更 快 地 找到 错误 。 


编程 ， 特 别 是 调试 ， 有 了 时候 会 引发 强烈 的 情绪 。 如 果 你 挣扎 于 一 个 
困难 的 bpug， 可 能 会 感觉 到 慎 奴 、 泪 丧 以 及 骞 迫 。 


有 证 据 表 明 ， 人 们 会 像 对 待人 一 样 对 竺 电脑。 当 电 脑 民 好 完成 工作 
时 ， 我 们 会 把 它们 当 作 队友 ， 而 当 它 们 难以 控制 、 粗 骏 无 礼 的 时 候 ， 我 
们 会 按照 对 竺 那些 粗暴 固执 的 人 一 样 对 竺 它们 (The Media Equation: 
How People Treat Computers, Television, and New Media Like Real People 
and Places , Reeves#lINass#) 。 


对 这 些 反 应 行为 有 所 准备 ， 可 能 会 帮助 你 更 好 地 对 待 电脑。 一 种 方 


法 是 把 它 当 作 你 的 雇员 ， 它 有 一 定 的 长 处 ， 如 速度 和 精度 ， 也 有 特定 的 
弱点 ， 如 没有 同情 心 和 无 法 顾全 大 局 。 








你 的 任务 是 做 一 个 好 经 理 : 设法 扬长 避 短 ， 并 找到 方法 控制 你 的 情 
绪 去 面 对 问 题 ， 而 不 是 让 你 的 反应 影响 工作 效率 。 


能 
之 外 还 有 很 多 用 途 。 每 章 的 结尾 处 都 有 一 市 类 似 于 本 节 的 关于 调试 技巧 


学 习 调 试 可 能 会 带 来 挫折 感 ， 但 它 是 一 个 有 价值 的 技能 ， 并 在 编程 
的 讨论 。 希 望 它们 能 带 来 帮助 ! 


I8 Wop 


问题 求解 (problem solving) : 
解决 方案 的 过 程 。 


总 结 
高 级 语言 
言 ， 如 Python 


问题 、 寻 找 解 决 方案 以 及 表达 


(high-level language) : 设计 来 方便 人 们 读 写 的 编程 语 
言 ， 也 被 称 为 “机 器 


低级 语言 (Jow-level language) : 设计 来 方便 计算 机 执行 的 编程 语 
语言 ?或 “汇编 语言 ” 
可 移植 性 (portability) : 程序 的 一 种 属性 : 可 以 在 多 种 类 型 的 计 
算 机 上 运行 
解释 器 (interpreter) : 一 个 读 
提示 符 
用 户 的 输入 


取 其 他 程序 并 执行 其 内 容 的 程序 。 
(prompt) : 解释 器 显示 的 文字 ， 提 示 用 户 已 经 准备 好 接收 


程序 (program) : 一 系列 代码 指令 的 集合 
Print 语句 (print statement) : 
屏幕 上 显示 一 个 值 。 


旨 定 一 种 运算 。 

一 个 指令 ， 可 以 通知 Python 解释 器 在 
操作 符 Coperator) : 一 种 特殊 符号 ， 
串 拼接 等 简单 运算 。 





用 来 表达 加 法 、 乘 法 或 
值 (value) : 程序 操作 的 数据 基本 单位 ， 如 一 个 数字 或 一 个 


RPS AY 


字符 


PS 5A 


a 


类 型 (type) : 值 的 类 别 。 到 目前 为 止 我 们 已 经 见 过 的 类 型 有 整数 
(int) 、 浮 点 数 (float) FRB (str). 


整 型 (integer) : 用 来 表示 整数 的 类 型 。 

浮 点 型 (floating-point) : 用 来 表示 带 小 数 部 分 的 数 的 类 型 。 
字符 串 (string) : 用 来 表示 一 串 字 符 的 类 型 。 

目 然 语言 (natural language) : 目 然 演化 而 来 的 人 们 所 说 的 语言 。 


形式 语言 (formal language) : 人 们 设计 为 某 些 特定 目的 〈 如 表达 
数学 概念 或 者 计算 机 程序 ) 设计 的 任何 一 种 语言 。 所 有 编程 语言 都 属于 


形式 语言 。 











记号 (token) : 程序 的 语法 结构 的 最 基本 单位 ， 类 似 于 目 然 语言 
中 的 词 。 


语法 (syntax) : 用 于 控制 程序 结构 的 规则 。 
语法 分 析 (parse〉: 检查 程序 并 分 析 其 语法 结构 。 
bug: 程序 中 的 错误 。 


调试 (debugging) : 发 现 和 纠正 bug 的 过 程 。 


19 练习 


练习 1-1 


在 计算 机 前 阅读 本 书 是 一 个 好 主意 ， 因 为 你 可 以 边 看 边 试验 书 中 的 
示例 。 
每 当 你 试验 新 的 语言 特性 时 ， 应 当 试 着 故意 犯错 。 例 如 ， 


在 “Hello，World!”* 程 序 中 ， 如 果 少 写 一 个 引号 ， 会 发 生 什么 ? 如果 两 个 
引号 都 不 写 ， 会 怎么 样 ? 如 果 把 print 拼写 错 了 ， 会 如 何 ? 





这 种 试验 会 帮 你 记 住所 读 的 内 容 ， 也 能 帮 你 学 会 调试 ， 因 为 这 样 能 
看 到 不 同 的 出 错 消息 代表 着 什么 。 现 在 故意 犯错 总 比 今 后 在 编码 中 意外 
出 错 好 。 


1. 在 print 语句 中 ， 如 果 漏 掉 一 个 括号 ， 或 者 两 个 都 漏 掉 ， 会 发 
生 什 么 ? 


2. 如 果 正 妾 试 打印 一 个 字符 串 ， 那 么 铬 漏 挥 一 个 或 所 有 的 引号 ， 
会 及 生 什 么 ? 


3. 可 以 使 用 一 个 负 号 来 表示 负数 ， 如 -2 。 如 果 在 数字 之 前 放 一 个 
IES, BREA? 如 果 是 2++2 呢 ? 





4. 在 数学 标记 里 ， 前 置 0 是 没有 问题 的 ， 如 82 。 在 Python 中 也 这 人 么 
RRETA 


5. 如 果 在 两 个 值 之 间 不 放任 何 操作 符 ， 会 发 生 什么 ? 
练习 1-2 


启动 Python 解 释 器 ， 把 它 当 作 计 算 器 使 用 。 





1. 在 42 分 42 秒 中 ， 一 共有 多 少 秒 ? 





2. 10 干 米 相当 于 多 少 英 里 ? 提示 : 1 英里 相当 于 1.61 干 米 。 


3. 如 果 你 用 42 分 42 秒 跑 完 10 干 米 ， 那 么 你 的 平均 速度 ( 跑 1 干 米 需 
要 的 分 钟 和 秒 数 ) 是 多 少 ? 平均 速度 是 多 少 干 米 每 小 时 ? 





[1] “The penny dropped” 在 英语 里 的 意思 是 : 经 过 一 段 困 惑 后 ， 突 然 理解 
了 某 个 事情 。 一 一 译 者 注 


第 2 章 ”变量 、 表 达 式 和 语句 





编程 语言 最 强大 的 特性 之 一 是 操纵 变量 的 能 力 。 变 量 是 指 同一 个 
值 的 名 称 。 


2.1 赋值 语句 


赋值 语句 可 以 建立 新 的 变量 ， 并 给 它们 赋值 : 


>>> message = ‘And now for somthing completely different’ 
>>> n = 17 


>>> pi = 3.1415926535897932 





这 个 例子 有 3 个 赋值 。 第 一 个 将 一 个 字符 串 赋 给 叫 作 message 的 变 
量 ; 第 二 个 将 17 赋值 给 n ; 第 三 个 将 n 的 (近似 ) 值 赋 给 变量 pi 。 


在 纸 上 表 达 变 量 的 一 个 常见 方式 是 写 下 名 称 ， 并 用 第 涉 指 向 其 值 。 
这 种 图 称 为 状态 图 ， 因 为 它 显示 了 每 个 变量 所 在 的 状态 (请 将 它 看 作 
变量 的 心理 状态 ) 。 图 2-1 显 示 了 前 面 例子 的 状态 图 。 








message 一 = And now for something completely different’ 


n —>= 17 


pi —= 3.1415926535897932 





图 2-1 ”状态 图 


FET R E Fe PEA N MAANEN Be 44 —— DA E BY 

变量 名 可 以 任意 长 短 。 它 可 以 包含 字母 和 数字 ， 但 必须 以 一 个 字母 
开头 。 使 用 大 写字 母 是 合法 的 ， 但 变量 名 使 用 小 写字 母 开 头 是 个 好 主意 
(后 面 你 会 看 到 为 何如 此 〉。 








下 划 线 “_” 可 以 出 现在 变量 名 称 中 。 它 经 常 出 现在 由 多 个 词组 成 的 
变量 名 中 ， 如 your_name 或 aijrspeed _of_unladen_swallow。 


如 果 给 变量 取 非 法 的 名 称 ， 会 得 到 一 个 语法 错误 : 


>>> 76trombones = 'big parade’ 
SyntaxError: invalid syntax 
>>> more@ = 1000000 
SyntaxError: invalid syntax 


>>> class = ‘Advanced Theoretical Zymurgy' 
SyntaxError: invalid syntax 





76trombones 非法 ， 因 为 它 以 数字 开头 。more@ 非法 ， 是 因为 它 
包含 了 一 个 非法 字符 @ 。 但 class 有 什么 问题 ? 


原因 是 class 是 Python 的 一 个 关键 字 。 解 释 器 通过 关键 字 来 识别 程 
序 的 结构 ， 并 且 它 们 不 能 用 来 作为 变量 名 称 


Python 2 共有 31 个 关键 字 : 


False class finally is 


None continue for 
True def 


return 
lambda try 


nonlocal while 
with 


or yield 
import pass 
break except in 


from 


and del global not 
as elif if 


assert else 


raise 





你 并 不 需要 记 住 这 个 清单 。 在 大 多 数 开发 环境 中 ， 关 键 字 会 以 不 同 
的 颜色 显示 。 如 果 把 它们 当 作 变量 来 用 ， 会 很 容易 发 现 。 
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表达 式 是 值 、 变 量 和 操作 符 的 组 合 。 单 独 一 个 值 也 被 看 作 一 个 表 
达 式 ， 单 独 的 变量 也 是 如 此 。 所 以 下 面 都 是 合法 的 表达 式 : 





当 你 在 提示 符 之 后 键入 一 个 表达 式 时 ， 解 释 需 会 对 其 进行 求 值 ， 
即 和 尝试 找 到 该 表达 式 的 最 终 值 。 在 本 例 中 ， 变 量 n 的 值 是 17， 而 表达 


rin + 25 的 值 是 42。 





语句 是 一 段 会 产生 效果 的 代码 单元 ， 如 创建 新 变量 或 者 显示 一 个 
值 。 
>>> n = 17 


>>> print(n) 


第 一 行 是 一 个 赋值 语句 ， 将 值 17 赋 给 变量 n 。 第 二 行 是 一 个 print 
语句 ， 显 示 变量 n 的 值 。 

当 键入 一 行 语句 之 后 ， 解 释 器 会 执行 它 ， 也 就 是 说 会 按照 语句 所 说 
的 来 做 。 通 常 来 说 ， 语 句 本 身 没有 值 。 


2.4 脚本 模式 


到 目前 为 止 我 们 都 是 在 交互 模式 (interactive mode) 下 运行 
Python， 直 接 与 解释 器 打交道 。 交 互 模式 非常 适合 入 门 ， 但 是 ， 如 果 你 
需要 编写 超过 几 行 的 代码 ， 它 可 能 显得 有 点 儿 笨 拙 。 





另 一 种 编程 模式 是 把 代码 保存 称 为 脚本 的 文件 中 ， 并 以 脚本 模式 
(script mode) 运行 解释 器 ， 执 行 脚本 。 依 照 惯例 ，Python 脚 本 文件 通 
常 以 .py 结尾 。 


如 采 你 已 经 了 解 在 自己 的 电脑 上 如 何 创建 和 运行 脚本 ， 就 可 以 继续 
学 习 了 。 人 否则 我 再 次 建议 使 用 PythonAnywhere。 我 在 
http://tinyurl.com/thinkpython2e 上 写 下 了 如 何在 脚本 模式 下 运行 的 指导 。 








由 于 Python 提 供 了 两 种 运行 模式 ， 你 可 以 在 交互 模式 中 尝试 代码 片 
段 ， 然 后 将 其 放 到 脚本 中 。 但 交互 模式 和 脚本 模式 还 是 有 一 些 区 别 的 ， 
可 能 会 引起 困惑 。 





例如 ， 如 采 使 用 Python 作为 计算 右 ， 你 可 能 会 输入 : 


>>> miles = 26.2 
>>> miles * 1.61 
42.182 





第 一 行 给 变量 miles 赋值 ， 但 没有 可 见 的 效果 。 第 二 行 是 一 个 表达 
式 ， 所 以 解释 器 对 其 进行 求 值 ， 并 显示 结果 。 于 是 我 们 知道 马拉松 的 长 


度 大 概 是 42 千 米 。 





但 如 果 将 上 面 同样 的 代码 写 入 到 脚本 中 并 运行 ， 则 得 不 到 任何 输 
出 。 在 脚本 模式 中 ， 一 个 单独 的 表达 式 ， 也 是 没有 可 见效 果 的 。Python 
实际 上 会 对 表达 陈 进 行 求 值 ， 但 不 会 显示 其 结果 。 除 非 你 叫 它 这 么 做 : 


miles = 26.2 
print (miles * 1.61) 


这 种 现象 一 开始 可 能 会 让 人 迷惑 。 








脚本 通常 包含 一 系列 的 语句 。 如 果 语 句 超 过 一 行 ， 那 么 会 随 着 语句 
执行 的 顺序 一 行 行 显示 结果 。 





例如 ， 脚 本 





产生 如 下 结 


1 
2 


赋值 语句 不 会 产生 任何 输出 。 


为 了 验证 你 的 理解 ， 可 以 在 Python 解释 器 中 输入 下 面 的 语句 ， 看 它 


们 做 了 什么 : 


x xu 
+ Il 
Pu 


现在 把 同样 的 语句 存 入 到 一 个 脚本 文件 并 运行 。 输 出 是 什么 ?修改 
脚本 ， 将 所 有 的 表达 式 都 转换 成 print 语句 ， 再 运行 一 过。 


2.5 Pee lire 


当 一 个 表达 式 中 出 现 多 个 操作 符 时 ， 求 值 的 顺序 依赖 于 优先 级 规则 


。 对 数学 操作 符 ，Python 遵 守 数 学 的 传统 规则 。 纵 上 略 词 PREMDAS 可 以 
帮助 记忆 这 些 规则 : 





hiy (P, Parentheses) 拥有 最 高 的 优先 级 ， 并 可 以 用 来 强制 表达 
式 按照 你 需要 的 顺序 进行 求 值 。 因 为 括号 中 的 表达 式 会 先 执行 ， 所 
以 2*(3-1) 的 结果 是 4， 而 (1+1)**(5-2) 的 结果 是 8。 你 也 可 以 利 
用 括号 使 得 表达 式 更 加 易 读 ， 就 像 (minute*166)/66 这 样 ， 即 使 
这 里 增加 括号 并 不 会 改变 结果 。 

乘 方 (E ，Exponentiation ) 操作 拥有 次 高 的 优先 级 ， 所 以 1+2**3 
的 结果 是 9， 而 不 是 27， 而 且 2 * 3**2 的 结果 是 18， 而 不 是 36。 
乘法 (M ，Multiplication〉 和 除法 (D , Division) 优先 级 相同 ， 
并 且 高 于 亦 有 相同 优先 级 的 加 法 CA, Addition) 和 减法 CS, 
Substraction) 。 所 以 2*3-1 是 5， 而 不 是 4， 并 且 6+4/2 是 8， 而 不 
是 5。 

优先 级 相同 的 操作 按照 自 左 向 右 的 顺序 求 值 《除了 乘 方 以 外 ) 。 所 
以 表达 式 degrees/2*pi ， 除 法 在 乘法 之 前 执行 ， 结 果 乘 以 pi 。 如 
果 想 除 以 2xn， 可 以 使 用 括号 ， 或 者 写 为 degrees/2/pi。 














其 他 操作 符 的 优先 级 ， 我 并 不 会 伦 太 多 功夫 记 下 来 。 如 果 只 看 表达 


式 不 能 确定 的 话 ， 使 用 括号 指明 优先 级 即 可 。 


2.6 FAT PETE 


通常 来 说 ， 字 符 串 不 能 进行 数学 操作 。 即 使 看 起 来 像 数 字 也 不 行 。 
下 面 的 操作 是 非法 的 : 


"eggs'/'easy' "third'*'a charm’ 





但 有 两 个 例外 : + 和 *。 


操作 符 + 进 行 字符 串 拼 接 (string concatenation) 操作 ， 意 即将 前 后 
两 个 字符 首尾 连接 起 来 。 例 如 : 





>>> first = 'throat' 
>>> second = ‘warbler' 
>>> first + second 


throatwarbler 





操作 符 * 也 适用 于 字符 串 ;， 它 进行 重复 操作 。 例 如 ，'Spam'*3 的 结 
果 是 'SpamSpamSpam'。 如 果 * 的 两 个 操作 对 象 之 一 是 字符 串 ， 那 男 一 
个 必须 是 整数 。， 





字符 串 的 t+ 和 * 的 应 用 ， 实 际 上 和 数字 的 加 法 与 乘法 类 似 。 就 像 4*3 
与 4+4+4 相等 一 样 ， 我 们 预期 'Sspam'*3 与 'Spam'+'Spam'+'Spam' 也 
相等 ， 实 际 也 确实 如 此 。 另 一 方面 ， 字 符 串 的 拼接 与 重复 操作 和 整数 的 
加 法 与 乘法 操作 也 有 很 大 的 不 同 。 你 能 够 想 出 加 法 的 一 个 属性 ， 字 符 串 
拼接 操作 并 不 支持 吗 ? 


2.7 注释 
当 程序 变 得 更 大 更 复杂 时 ， 读 起 来 也 更 困难 。 形 式 语言 很 紧凑 ， 经 
常会 遇 到 一 段 代码 ， 却 很 难 弄 清 它 在 做 什么 、 为 什么 那么 做 。 


因此 ， 在 程序 中 加 入 自然 语言 的 笔记 来 解释 程序 在 做 什么 ， 是 个 好 
主意 。 这 种 笔记 被 称 为 注释 (comments) ， 它 们 以 # 开头 : 


# compute the percentage of the hour that has elapsed 
percentage = (minute * 100) / 60 


FEIX PF HL, ERRI 17 HY DAE PEE ST A 
FE: 


percentage = (minute * 100) / 60 # percentage of an hour 


MAFF We BIJAT FE MERE N SPB RETE is EH E E AT EFAS 
FZT OCA FEAT 











注释 最 重要 的 用 途 在 于 解释 代码 并 不 显而易见 的 特性 。 我 们 可 以 合 
理 地 认为 读者 可 以 看 懂 代 码 在 做 什么 ， 因 此 使 用 注释 来 解释 为 什么 这 
么 做 ， 要 有 用 得 多 。 








下 面 这 段 注 释 与 代码 重复 ， 守 无 用 处 : 


v = 5 # 将 5 赋值 给 v 


Pt 
而 下 面 这 段 注释 则 包含 了 代码 中 看 不 到 的 有 用 信息 : 


# 速度 ， 单 位 是 米 / 秒 


< 
ll 
vI 





选择 好 的 变量 名 称 ， 可 以 减少 注释 的 需要 ， 但 长 名 字 也 会 让 复杂 表 
达 式 更 难 阅 读 ， 所 以 这 两 者 之 间 需 要 衡量 舍 取 。 





2.8 调试 


一 个 程序 中 可 能 出 现 3 种 错误 : 语法 错误 、 运 行 时 错误 和 语义 错 
误 。 对 它们 加 以 区 分 ， 可 以 更 快 地 找到 错误 。 


语法 错误 

语法 指 的 是 程序 的 结构 以 及 此 结构 的 规则 。 例 如 ， 括 号 必须 前 后 匹 
配 ， 所 以 (1+2) 是 合法 的 ， 而 8) 就 是 一 个 语法 错误 。 

程序 中 只 要 出 现 一 处 语法 错误 ，Python 就 会 显示 出 错 消 息 并 退出 ， 
你 的 程序 就 无 法 运行 了 。 在 编程 生涯 的 最 初 儿 周 中 ， 可 能 会 需要 花费 大 


量 时 间 来 查找 语法 错误 。 但 随 着 经 验 的 增加 ， 犯 错 会 越 来 越 少 ， 查 找 起 
来 也 会 越 来 越 快 。 








运行 时 错误 





第 二 类 错误 是 运行 时 错误 ， 这 样 称 呼 是 因为 这 种 错误 只 有 程序 运行 
后 才 会 出 现 。 这 些 错误 也 常 被 称 为 寞 肖 (exception〉， 因 为 它们 第 第 表 
示 某 些 腊 常 的 (而 且 不 好 的 ) 事情 发 生 了 。 

运行 时 错误 在 开头 儿童 中 的 简单 示例 里 很 少 会 出 现 ， 所 以 可 能 要 过 
一 段 时 间 你 才 会 遇 到 。 


语义 错误 


第 三 类 错误 是 语义 错误 ， 意 思 是 错误 与 含义 相关 。 如 果 你 的 程序 中 
有 一 个 语义 错误 ， 程 序 仍 会 成 功 运 行 ， 而 不 会 产生 任何 出 错 消 轧 ， 但 是 
它 不 会 执行 正确 的 逻辑 。 它 会 做 其 他 的 事情 。 特 别 需 要 注意 的 是 ， 它 所 
做 的 正 是 你 的 代码 所 告诉 它 的 。 


得 找 语义 错误 会 比较 厅 烦 ， 因 为 需要 反 回 查找 ， 碍 看 程序 输出 并 答 
试 弄 明 白 它 到 底 做 了 什么 。 


2.9 Rib ex 
变量 (variable) : 引用 一 个 值 的 名 字 。 


赋值 语句 Cassignment statement) : 将 一 个 值 赋值 给 变量 的 语句 。 





状态 图 (state diagram) : 用 来 展示 一 些 变量 以 及 其 值 的 图 示 。 


关键 字 (keyword) : 编译 占 或 解释 器 保留 的 词 ， 用 于 解析 程序 ; 
变量 名 不 能 使 用 关键 字 ， 如 if ，def ，while 等 。 


操作 数 Coperand) : 操作 符 所 操作 的 值 。 


表达 式 (expression) : 变量 、 操 作 符 和 值 的 组 合 ， 可 以 表示 一 个 
单独 的 结果 值 。 


求 值 Cevaluate) : 对 表达 式 按照 操作 的 顺序 进行 计算 ， 求 得 其 结 
果 值 。 


语句 (statement) : 表示 一 个 命令 或 动作 的 一 段 代码 。 人 至 今 我 们 见 
过 赋值 语句 和 打印 语句 。 


执行 Cexecute) : 运行 一 条 语句 ， 看 它 说 的 是 什么 。 


交互 模式 (interactive mode) : 使 用 Python 解 释 右 的 一 种 方式 ， 在 
提示 符 之 后 键入 代码 。 


脚本 模式 (script mode) : 使 用 Python 解 释 器 的 一 种 方式 ， 从 脚本 


中 读 入 代码 并 运行 它 。 
脚本 (script) : 保存 在 文件 中 的 程序 。 
操作 顺序 (order of operations) : 当 表 达 式 中 有 多 个 操作 符 和 操作 





对 象 要 求 值 时 ， 用 于 指导 求 值 顺序 的 规则 。 
拼接 Cconcatenate) :将 两 个 操作 数 首 尾 相 连 。 


注释 Ccomment) : 代码 中 附加 的 注解 信息 ， 


阅读 代码 ， 并 不 影响 程序 的 运行 。 
语法 错误 (syntax error) : 程序 中 的 一 种 错误 ， 叶 致 它 无 法 进行 语 





法 解析 (因此 也 无 法 被 解释 器 执行 》。 
异常 (exception) + 程序 运行 中 发 现 的 错误 。 
语义 (semantics) ， 程 序 表达 的 含义 。 
语义 错误 (semantic error) : 程序 中 的 一 种 错误 ， 导 致 程序 所 做 的 








事情 不 是 程序 员 设 想 的 。 





2.10 ”练习 


练习 2-1 


重申 上 一 张 的 建议 ， 每 当 你 学 习 新 语言 特性 时 ， 都 应 当 在 交互 模式 
中 进行 尝试 ， 并 故意 犯 下 错误 ， 看 会 有 哪些 问题 。 


。 我们 已经 见 过 n = 42 是 合法 的 。 那 么 42 = ne? 

e HAx = y = 1 呢 ? 

。 有 些 语言 中 ， 每 个 语句 都 需要 以 分 号 〈;) 结尾 。 如 果 你 在 Python 语 
句 的 结尾 放 一 个 分 号 ， 会 有 什么 情况 ? 

。 如 果 在 语句 结尾 放 的 是 句号 呢 ? 

。 在 数学 标记 中 ， 对 于 x 乘 以 y ， 可 以 这 么 表达 : xy 。 在 Python 中 这 
样 尝试 会 有 什么 结果 ? 





练习 2-2 
把 Python 解 释 占 当 作 计算 器 来 进行 练习 。 
1. 半径 为 r 的 球体 的 体积 是 (4/3)rr 3 。 半 径 为 5 的 球体 体积 是 多 少 ? 


2. 假设 一 本 书 的 定价 是 24.95 美 元 ， 但 是 书店 打 了 40% 的 折扣 (6 
H) 。 运 费 是 一 本 3 美元 ， 每 加 一 本 加 75 美 分 。60 本 书 的 总 价 是 多 少 ? 








3. 如 果 我 6:52 时 离开 家 ， 并 以 慢 速 (6 分 10 秒 / 千 米 ) 跑 1.6 干 米 ， 
接 下 来 以 4 分 30 秒 / 千 米 的 速度 跑 4.8 干 米 ， 再 以 慢 速 跑 1.6 干 米 。 请 问 我 
回 家 吃 早餐 是 什么 时 候 ? 


在 程序 设计 中 ， 函 数 是 指 用 于 进行 某 种 计算 的 一 系列 语句 的 有 名 
称 的 组 合 。 定 义 一 个 函数 时 ， 需 要 指定 函数 的 名 称 并 写 下 一 系列 程序 语 
句 。 之 后 ， 就 可 以 使 用 名 称 来 “调用 ”这 个 函数 。 


3.1 ex za FG 


前 面 我 们 已 经 见 过 函数 调用 的 一 个 例子 : 


>>> type(42) 
<class ‘int'> 


这 个 函数 的 名 称 是 type ， 括 号 中 的 表达 式 我 们 称 之 为 函数 的 参数 
这 个 函数 调用 的 结果 是 求 得 参数 的 类 型 。 





我 们 通常 说 函数 “接收 参数， 并“ 返回” 结果。 这 个 结果 也 称 为 返回 


值 (return value) 。 


Python 提 供 了 一 些 可 将 茶 个 值 从 一 种 类 型 转换 为 力 一 种 类 型 的 函 
Blo int 函数 可 以 把 任何 可 以 转换 为 整 型 的 值 转换 为 整 型 ， 如 果 转 换 失 
败 ， 则 会 报错 : 


>>> int('32') 
32 


>>> int('Hello') 
ValueError: invalid literal for int(): Hello 





int 可 以 将 浮 点 数 转换 为 整数 ， 但 不 会 做 四 舍 五 入 操作 ， 而 是 直接 
舍弃 小 数 部 分 。 


>>> int(3.99999) 
3 

>>> int(-2.3) 

-2 


pT 


Float 函数 将 整数 和 字符 串 转 换 为 浮 点 数 : 


>>> Float(32) 
32.0 
>>> Float('3.14159') 


3.14159 





BUR, str 函数 将 参数 转换 为 字符 串 : 


>>> str(32) 
'32' 
>>> str(3.14159) 


"3.14159" 





3.2 ”数学 函数 


Python 有 一 个 数学 计算 模块 ， 提 供 了 大 多 数 和 常用 的 数学 函数 。 模 块 
(module) 是 指 包含 一 组 相关 的 函数 的 文件 。 


要 想 使 用 模块 中 的 函数 ， 需 要 移 使 用 import 语句 将 它 导 入 运行 环 


>>> import math 


这 个 语句 将 会 创建 一 个 名 为 math 的 模块 对 象 (module object) . 
如 果 显 示 这 个 对 象 ， 可 以 看 到 它 的 一 些 信息 : 


S 


>>> math 
<module 'math' (built-in)> 





pei actrees AMEE. ARW lA EH 
函数 ， 需 要 同时 指定 模块 名 称 和 函数 名 称 ， 用 一 个 句点 〈.) 分 隔 。 这 
个 格式 称 为 句点 表示 法 (dot notation〉。 


>>> ratio = signal_power / noise power 
>>> decibels = 10 * math.1logi1@(ratio) 


>>> radians = 0.7 
>>> height = math.sin(radians) 





上 面 第 一 个 例子 使 用 了 math .1og16 来 计算 以 分 贝 为 单位 的 信和 号 
声 比 (假设 signal_power #llnoise power 都 已 经 事先 定义 好 
J) 。math 模块 也 提供 了 log 函数 ， 用 来 计算 底 为 e 的 自然 对 数 。 





第 二 个 例子 计算 radians 的 正弦 值 。 这 个 变量 名 已 经 暗示 了 ，sin 
以 及 cos 、tan 等 三 角 函 数 接受 的 参数 是 以 弧度 (radians) 为 单位 的 。 
茶 要 将 角度 转换 为 弧度 ， 可 以 除 以 180 再 乘 以 nt: 


>>> degrees = 45 
>>> radians = degrees / 180.0 * math.pi 
>>> math.sin(radians) 


@.707106781187 








表达 式 math.pi 从 math 模块 中 获得 变量 pi 。 这 个 变量 的 值 是 nt 的 
浮 点 近似 值 ， 大 约 精 确 到 15 位 数字 。 





如 果 了 解 三 角 函 数 ， 可 以 把 上 面 的 结果 和 2 的 平方 根 的 一 半 进 行 比 


较 : 


>>> math.sqrt(2) / 2.0 
@.707106781187 





93 MH 





到 现在 为 止 ， 我 们 已 经 分 别 了 解 了 程序 的 基本 元 系 一 一 和 变量、 表达 
式 和 语句 ， 但 还 没有 接触 如 何 将 它们 有 机 地 组 合 起 来 。 


程序 设计 语言 最 有 用 的 特性 之 一 就 是 可 以 将 各 种 小 的 构建 块 
(building block) 组 合 起 来 。 例 如 ， 函 数 的 参数 可 以 是 任何 类 型 的 表达 
式 ， 包 括 算术 操作 符 : 


x = math.sin(degrees / 360.0 * 2 * math.pi) 


甚至 还 包括 函数 调用 : 


x = math.exp(math.1log(x+1) ) 


基本 上 ， 在 任何 可 以 使 用 值 的 地 方 ， 都 可 以 使 用 任意 表达 式 ， 只 有 
一 个 例外 : 赋值 表达 式 的 左边 必须 是 变量 名 称 ， 在 左边 放置 任何 其 他 的 
表达 式 都 是 语法 错误 《后面 我 们 还 会 看 到 这 条 规则 的 例外 情况 ) 。 


>>> minutes = hours * 60 
>>> hours * 60 = minutes 














SyntaxError: can't assign to operator 





3.4 添加 新 函数 


至 此 ， 我 们 都 只 是 在 使 用 Python 提供 的 函数 ， 其 实 我 们 也 可 以 上 自己 
添加 新 的 函数 。 函 数 定 义 指定 新 函数 的 名 称 ， 并 提供 一 系列 程序 语 
人 句 ， 当 函数 被 调用 时 ， 这 些 语句 会 顺序 运行 。 


下 面 是 一 个 例子 : 


def print_lyrics(): 
print ("I'm a lumberjack, and I'm okay.") 


print ("I sleep all night and I work all day.") 














def 是 关键 字 ， 表 示 接 下 来 是 一 个 函数 定义 。 这 个 函数 的 名 称 
是 print_lyrics 。 子 数 名 称 的 书写 规则 和 变量 名 称 一 样 : 字母 、 数 字 
和 下 划 线 是 合法 的 ， 但 第 一 个 字符 不 能 是 数字 。 关 键 字 不 能 作为 函数 
名 ， 而 且 我 们 应 尽量 避免 函数 和 变量 同名 。 











函数 名 后 的 空 括 号 表示 它 不 接收 任何 参数 。 


函数 定义 的 第 一 行 称 为 函 A Cheader) ， 其 他 部 分 称 为 函数 体 
(body) . && _ 该 以 冒号 函数 体 则 应 当 整 体 缩 进 一 级 。 依 照 
惯例 ， 缩 进 是 使 用 4 个 空格 ， 函数 体 的 代码 在 句 行 数 不 限 。 


本 例 中 print 语句 里 的 字符 串 使 用 双 引 号 括 起 来 。 单 引号 和 双 引 号 
的 作用 相同 。 大 部 分 情况 下 ， 人 们 都 使 用 单 引 号 ， 只 在 本 例 中 这 样 的 特 
殊 情 况 下 才 使 用 双 引 号 。 本 例 中 的 字符 串 里 本 里 就 存在 单 引 号 《这 里 的 


单 引 号 作为 缩 略 符号 用 ) 











代码 中 所 有 的 引号 (包括 双 引 号 和 单 引号 都 必须 是 “ 直 引 号 ”， 
常 在 键盘 上 的 Enter 键 附近 。 而 “ 斜 引 号 ”， 在 Python 中 是 非法 的 。 


如 果 在 交互 模式 里 输入 函数 定义 ， 则 解释 器 会 输出 省 略 写 (... ) 
提示 用 户 当 前 的 定义 还 没有 结束 : 





>>> def print_lyrics(): 
print("I'm a lumberjack, and I'm okay.") 
print("I sleep all night and I work all day.") 





想 要 结束 这 个 函数 的 定义 ， 震 要 输入 一 个 空 行 。 
定义 一 个 函数 会 创建 一 个 函数 对 象 ， 其 类 型 是 'function' 


>>> print(print lyrics) 

<function print_lyrics at @xb7e99e9c> 
>>> type(print_lyrics) 

<class 'function'> 





调用 新 创建 的 函数 的 方式 ， 与 调用 内 置 函 数 是 一 样 的 : 


>>> print_lyrics() 
I'm a lumberjack, and I'm okay. 


I sleep all night and I work all day. 





me LaF — eZ, EAT WE ee PA. Po, eR 
复 上 面 的 歌词 ， 我 们 可 以 写 一 个 repeat_lyrics KX: 





def repeat_lyrics(): 
print_lyrics() 


print_lyrics() 





然后 可 以 调用 repeat_1lyrics : 


>>> repeat_lyrics() 

I'm a lumberjack, and I'm okay. 

I sleep all night and I work all day. 
I'm a lumberjack, and I'm okay. 

I sleep all night and I work all day. 





3.5 定义 和 使 用 


将 前 面 一 节 的 代码 片段 整合 起 来 ， 整 个 程序 就 像 下 面 这 个 样子 : 


def print_lyrics(): 
print("I'm a lumberjack, and I'm okay.") 
print("I sleep all night and I work all day.") 


def repeat_lyrics(): 
print_lyrics() 
print_lyrics() 


repeat_lyrics() 





这 个 程序 包含 两 个 图 数 定 义 : print_ lyrics #lrepeat_lyrics 

函数 定义 的 执行 方式 和 其 他 语句 一 样 ， 不 同 的 是 执行 后 会 创建 函数 对 
四 函数 体 里 面 的 语句 并 不 会 立即 运行 ， 而 是 等 到 函数 被 调用 时 才 执 
行 。 函 数 定义 不 会 产生 任何 输出 。 





你 可 能 已 经 猜 到 ， ee 
数 定 义 必 须 在 函数 被 调用 之 前 先 运 


作为 练习 ， 将 程序 的 最 后 一 行 移 动 到 首 行 ， 于 是 函数 调用 会 匈 于 函 
数 定义 执行 。 运 行程 序 并 查看 会 有 什么 样 的 错误 信息 








现在 将 函数 调用 那 一 行 放 回 到 末尾 ， 并 将 函数 print_lyrics 的 定 
义 移 到 函数 repeat_lyrics 定义 之 后 。 这 时 候 运 行程 序 会 发 生 什么 ? 


3.6 ”执行 流程 


为 了 保证 函数 的 定义 先 于 其 首次 调用 执行 ， 需 要 知道 程序 中 语句 运 
行 的 顺序 ， 即 执行 流程 。 


执行 总 是 从 程序 的 第 一 行 开始 。 语 句 按照 从 上 到 下 的 顺序 逐一 运 





函数 定义 并 不 会 改变 程序 的 执行 流程 ， 但 应 注意 函数 体 中 的 语句 并 
不 立即 运行 ， 而 是 等 到 函数 被 调用 时 运行 。 





函数 调用 可 以 看 作 程 序 运 行 流程 中 的 一 个 迁 回路 笃 。 过 到 函数 调用 
时 ， 并 不 会 直接 继续 运行 下 一 条 语句 ， 而 是 跳 到 函数 体 的 第 一 行 ， 继 续 
运行 完 函 数 体 的 所 有 语句 ， 再 跳 回 到 原来 离开 的 地 方 。 


这 样 看 似 简 单 ， 但 马上 你 就 会 及 现 ， 函 数 体 中 可 以 调用 其 他 函数 。 
当 程 序 流程 运行 到 一 个 函数 之 中 时 ， 可 能 需要 运行 其 他 函数 中 的 语句 。 
而 后 ， 当 运行 那个 函数 中 的 语句 时 ， 又 可 能 再 需要 调用 运行 为 一 个 函数 
的 语句 ! 











幸好 Python 对 于 它 运 行 到 哪里 有 很 好 的 记录 ， 所 以 每 个 函数 执行 结 
束 后 ， 程 序 都 能 跳 回 到 它 离 开 的 地 方 。 直 到 执行 到 整个 程序 的 结尾 ， 才 
会 结束 程序 。 


总 之 ， 在 阅读 代码 时 ， 并 不 总 应 该 按照 代码 书写 顺序 一 行 行 阅读 ; 
有 时 候 ， 按 照 程 序 执行 的 流程 来 阅读 代码 ， 理 解 的 效果 可 能 会 更 好 。 


3.7 UBMs 出 


前 面 说 到 的 函数 有 些 需 要 传 入 参数 站。 例如 ， 当 调用 math. sin 
时 ， 需 要 传 入 一 个 数字 作为 实 参 。 有 的 函数 需要 多 个 实 参 : math .pow 
需要 两 个 ， 分 别 是 基数 Chase) 和 指数 Cexponent) 。 





在 函数 内 部 ， 实 参 会 赋值 给 称 为 形 参 Cparameter) 的 变量 。 下 面 的 
例子 是 一 个 函数 的 定义 ， 接 收 一 个 实 参 : 





def print twice(bruce): 
print(bruce) 
print(bruce) 





这 个 函数 在 调用 时 会 把 实 参 的 值 赋 到 形 参 bruce 上 ， 并 将 其 打印 两 


这 个 函数 对 任何 可 以 打印 的 值 都 可 用 。 


>>> print twice('Spam') 
Spam 

Spam 

>>> print twice(42) 


>>> print twice(math.pi) 
3.14159265359 
3.14159265359 





内 置 函 数 的 组 合 规 则 ， 在 用 户 自 定义 函数 上 也 同样 可 用 ， 所 以 我 们 


可 以 对 print_twice 使 用 任何 表达 式 作 为 实 参 : 


>>> print twice('Spam '*4) 

Spam Spam Spam Spam 

Spam Spam Spam Spam 

>>> print twice(math.cos(math.pi)) 


-1.0 
-1.0 





作为 实 参 的 表达 式 会 在 函数 调用 之 前 先 执 行 。 所 以 在 这 个 例子 中 ， 
表达 式 'Spam '*4 和 math.cos(math.pi) 都 只 执行 一 次 。 


也 可 以 使 用 变量 作为 实 参 : 


>>> michael = ‘Eric, the half a bee.' 
>>> print_twice(michael) 
Eric, the half a bee. 


Eric, the half a bee. 





作为 实 参 传 入 到 函数 的 变量 的 名 称 (michael ) 和 函数 定义 里 形 参 
的 名 称 (bruce ) 没有 关系 。 函 数 内 部 只 关心 形 参 的 值 ， 而 不 用 关心 它 
在 调用 前 叫 什么 名 字 ; 在 print_twice 函数 内 部 ， 大 家 都 叫 bruce 。 


3.8 变量 和 形 参 是 局 部 的 


在 函数 体内 新 建 一 个 变量 时 ， 这 个 变量 是 局 部 的 〈local) ， 即 它 
只 存在 于 这 个 函数 之 内 。 例 如 : 


def cat twice(part1, part2): 
cat = part1 + part2 


print_twice(cat) 





XS RABIES LE, KERER, HKR A. P 
面 是 一 个 使 用 这 一 函数 的 例子 : 


>>> linel "Bing tiddle ' 
>>> line2 "tiddle bang. ' 
>>> cat_twice(line1, line2) 
Bing tiddle tiddle bang. 
Bing tiddle tiddle bang. 





“cat_twice 结束 时 ， 变 量 cat 会 被 销毁 。 这 时 再 演 试 打印 它 的 


话 ， 会 得 到 一 个 异常 ， 


>>> print(cat) 
NameError: name ‘cat' is not defined 





形 参 也 是 局 部 的 。 例 如 ， 在 print_twice 函数 之 外 ， 不 存在 bruce 
E 


3.9 栈 图 


要 跟 踊 哪 些 变 量 在 哪些 地 方 使 用 ， 有 时 候 画 一 个 栈 图 (stack 
diagram) 会 很 方便 。 和 状态 图 一 样 ， 栈 图 可 以 展示 每 个 变量 的 值 ， 不 
同 的 是 它 会 展示 每 个 变量 所 属 的 函数 。 














每 个 函数 使 用 一 个 帧 包含 ， 帧 在 栈 图 中 区 是 一 个 带 铸 函数 名 称 的 
例子， 里面 有 函数 的 参数 和 变量 。 前 面 的 函数 示例 的 栈 图 如 图 3-1 所 
未。 


| line1 —> ’Bing tiddle ’ 
__main__ 
line2 —> ‘tiddle bang.’ 


part! —> ‘Bing tiddle ’ 


cat_twice | part2 —> ‘tiddle bang.’ 
cat —> ’Bing tiddle tiddle bang.’ 


print_twice | bruce —> ‘Bing tiddle tiddle bang.’ 


图 3-1 $R] 





图 中 各 个 帧 从 上 到 下 安排 成 一 个 栈 ， 能 够 展示 出 哪个 函数 被 哪个 函 
数 调用 了 。 在 这 个 例子 里 ，print_twice 被 cat_twice 调用 ， 
而 cat_twice 被 _main 调用 。 main _ 是 用 于 表示 整个 栈 图 的 图 
框 的 特别 名 称 。 在 所 有 函数 之 外 新 建 变 量 时 ， 它 就 是 属于 __main__ 


的 。 


每 个 形 参 都 指向 与 其 对 应 的 实 参 相同 的 值 ， 所 以 ，part1 Mlinel 
的 值 相同 ，part2 和 1ine2 的 值 相同 ， 而 bruce 和 cat 的 值 相同 。 


如 果 调 用 函数 的 过 程 中 发 生 了 错误 ，Python 会 打印 出 函 — 调用 
它 的 函数 的 名 称 ， 以 及 调用 这 个 调用 者 的 函数 名 ， 依 此 类 推 ， 


到 main 


例如 ， 如 果 在 print_twice 中 访问 cat 变量 ， 则 会 得 到 一 


个 NameError: 


Traceback (innermost last): 
File "test.py", line 13, in _main_ 
cat_twice(line1, line2) 
File "test.py", line 5, in cat twice 
print_twice(cat) 


File "test.py", line 9, in print_twice 
print cat 
NameError: name ‘cat' is not defined 





ETEK PR A FE RAK A BL Ctraceback) 。 它 告诉 你 错误 出 现在 
哪个 程序 文件 ， 哪 一 行 ， 以 及 哪些 函数 正在 运行 。 它 也 会 显示 导致 错误 
的 那 一 行 代码 。 





回 漳 中 函数 的 顺序 和 栈 图 中 图 框 的 顺序 一 致 。 当 前 正在 执行 的 函数 
在 最 底部 


3.10 AIK ENÉ eA BAC El PB 


在 我 们 使 用 过 的 函数 中 ， 有 一 部 分 函数 ， 如 数学 函数 ， 会 返 
果 。 因 为 没有 想到 更 好 的 名 字 ， 我 称 这 类 函数 为 有 返回 值 函 数 (fruitful 
function) 。 a 如 print_twice ， 会 执行 一 个 动作 ， 但 不 返 
回 任 何 值 。 我 们 称 RAOR [al {eek 2 (void function) 。 


当 调 用 一 个 有 返回 值 的 函数 时 ， 大 部 分 情况 下 你 都 想 要 对 结果 做 某 
种 操作 。 例 如 ， 你 可 能 会 想 把 它 赋 值 给 一 个 变量 ， 或 者 用 在 一 个 表达 式 


x = math.cos(radians) 
golden = (math.sqrt(5) + 1) / 2 


在 交互 模式 中 调用 函数 时 ，Python 会 直接 显示 结果 : 


>>> math.sqrt(5) 
2.2360679774997898 


但 是 在 脚本 中 ， 如 果 只 是 直接 调用 这 类 函数 ， 那 么 它 的 返回 值 就 会 
永远 丢失 掉 ! 


math.sqrt(5) 


这 个 脚本 计算 5 的 平方 根 ， 但 由 于 并 没有 把 计算 结果 存储 到 茶 个 变 





量 中 ， 或 显示 出 来 ， 所 以 其 实 设 什 么 实际 作用 。 








无 返回 值 函 数 可 能 在 屏幕 上 显示 某 些 东西 ， 或 者 有 其 他 的 效果 ， 但 
是 它们 没有 返回 值 。 如 果 把 该 结果 赋值 给 某 个 变量 ， 则 会 得 到 一 个 特殊 
的 值 None 。 





>>> result = print_twice('Bing') 
Bing 
Bing 


>>> print result 
None 





值 None 和 字符 串 'None" 并 不 一 样 。 它 是 一 个 特殊 的 值 ， 有 上 自己 独 
特 的 类 型 : 


>>> print type(None) 
<class 'NoneType' > 


到 目前 为 止 ， 我 们 目 定 义 的 函数 都 是 无 返回 值 函 数 。 再 过 几 章 我 们 
就 会 开始 写 有 返回 值 的 函数 了 。 





3.11 为 什么 要 有 函数 


为 什么 要 人 花 功 夫 将 程序 拆 分 成 函数 呢 ? 也 许 刚 开始 编程 的 时 候 这 其 
中 的 原因 并 不 明晰 。 下 面 这 些 解 释 孝 可 作为 参考 。 


。 新 建 一 个 函数 ， 可 以 让 你 有 机 会 给 一 组 语句 命名 ， 这 样 可 以 让 代码 
更 易 读 和 更 易 调 试 。 

。 图 数 可 以 通过 减少 重复 代码 使 程序 更 短小 。 后 面 如 条 需 要 修改 代 
码 ， 也 只 要 修改 一 个 地 方 即 可 。 

。 将 一 长 段 程序 拆 分 成 几 个 函数 后 ， 可 以 对 每 一 个 函数 单独 进行 调 
试 ， 再 将 它们 组 装 起 来 成 为 完整 的 产品 。 

。 一 个 设计 展 好 的 函数 ， 可 以 在 很 多 程序 中 使 用 。 书 写 一 次 ， 调 试 一 
次 ， 复 用 无 穷 。 





3.12 调试 


你 将 会 掌握 的 一 个 最 重要 的 技能 就 是 调试 。 虽 然 调 试 可 能 时 有 烦 
恼 ， 但 它 的确 是 编程 活动 中 最 耗 脑力 、 最 有 挑 成 、 最 有 趣 的 部 分 。 


在 茶 种 程度 上 上， 调试 和 刑侦 工作 很 像 。 你 会 面 对 一 些 线索 ， 而 且 必 
须 推导 出 事情 发 生 的 过 程 ， 以 及 导致 现场 结果 的 事件 。 


调试 也 像 是 一 种 实验 科学 。 一 旦 猜 出 错误 的 可 能 原因 ， 就 可 以 修改 
程序 ， 再 运行 一 次 。 如 宋 猜 对 了 ， 那 么 程序 的 运行 结果 会 符合 预测 ， 这 
样 就 离 正 确 的 程序 更 近 了 一 步 。 如 采 猜 错 了 ， 则 需要 重新 思考 。 正 如 夏 
次 元 "福尔摩斯 所 说 的 :“ 当 你 排除 挥 所 有 的 可 能 性 ， 那 么 剩 下 的 ， 不 管 
多 么 不 可 能 ， 必 定 是 真相 。”( 柯 南 : 道 尔 《四 签名 》) 











对 东 些 人 来 说 ， 编 程 和 调试 是 同一 件 事 。 也 就 是 说 ， 编 程 正 是 不 断 
调试 修改 直到 程序 达到 设计 目的 的 过 程 。 这 种 想法 的 要 旨 是 ， 应 该 从 一 
个 能 做 茶 些 事 的 程序 开始 ， 然 后 做 一 点 点 修改 ， 并 调试 修改 ， 如 此 迭 
代 ， 以 确保 总 是 有 一 个 可 以 运行 的 程序 。 








例如 ，Linux 是 包含 了 数 百 万 行 代码 的 操作 系统 ， 但 最 开始 只 是 
Linus Torvalds 编 写 的 用 来 研究 Intel 80386 心 帮 的 简单 程序 。 据 Larry 


Greenfield 所 说 :“Linus 最 早 的 一 个 程序 是 交 蔡 打印 AAAA 和 BBBB。 后 
来 这 些 程 序 演化 成 了 Linuxz。”(“《Linux 用 户 指 南 》Beta 乒 本 1) 


3.13 术语 表 


函数 (function) : 一 个 有 名 称 的 语句 序列 ， 可 以 进行 菜 种 有 用 的 
操作 。 函 数 可 以 接收 或 者 不 接收 参数 ， 可 以 返回 或 不 返回 结 





eke SC (function definition) : 一 个 用 来 创建 新 水 数 的 语句 ， 指 
函数 的 名 称 、 参 数 以 及 它 包 合 的 语句 序列 。 


函数 对 象 (function object) : 函数 定义 所 创建 的 值 。 函 数 名 可 以 
用 作 变 量 来 引用 一 个 函数 对 象 。 


Kk (header) : 函数 定义 的 第 一 行 。 
函数 体 (body) : 函数 定义 内 的 语句 序列 。 


形 参 (parameter) : 函数 内 使 用 的 用 来 引用 作为 实 参 传 入 的 值 的 
名 称 。 


函数 调用 (function call) : 运行 一 个 函数 的 语句 。 它 由 函数 名 称 
和 括号 中 的 参数 列表 组 成 。 


X (argument) : KAOH, EEA cre. XER RM 
值 给 对 应 的 形 参 。 











局 部 变量 (local variable) : 函数 内 定义 的 变量 。 局 部 变量 只 能 在 
函数 体内 使 用 。 


返回 值 (return value) : 函数 的 结果 。 如 果 函 数 被 当 作 表达 式 调 


用 ， 返 回 值 就 是 表达 式 的 值 。 
有 返回 值 函 数 (fruitful function) : 返回 一 个 值 的 函数 。 
无 返回 值 函数 (void function) : 总 是 返回 None 的 函数 。 
None: 由 无 返回 值 函 数 返 回 的 一 个 特殊 值 。 


模块 (module) : 一 个 包含 相关 函数 以 及 其 他 定义 的 集合 的 文 
aa 


import 语 句 (import statement) : 该 入 一 个 模块 文件 ， 并 创建 一 个 
模块 对 象 的 语句 。 


模块 对 象 (module object) : 使 用 import 语句 时 创建 的 对 象 ， 提 
供 对 模块 中 定义 的 值 的 访问 。 


句点 表示 法 (dot notation) : 调用 男 一 个 模块 中 的 函数 的 语法 ， 使 
用 模块 名 加 上 一 个 句点 符号 ， 再 加 上 函数 名 。 


组 合 (composition) : 使 用 一 个 表达 式 作 为 更 大 的 表达 式 的 一 部 
分 ， 或 者 使 用 语句 作为 更 大 的 语句 的 一 部 分 。 


执行 流程 (flow of execution) : 语句 运行 的 顺序 。 





栈 图 (stack diagram) : 函数 栈 的 图 形 表达 形式 ， 也 展示 它们 的 变 
， 以 及 这 些 变 量 引 用 的 值 。 


tn 


BHE (frame) : 栈 图 中 的 一 个 图 框 ， 表 达 一 个 水 数 调用 。 它 包含 


了 局 部 变量 以 及 函数 的 参数 。 


回溯 Ctraceback) : 当 异 和 常 发 生 时 ， 打 印 出 正在 执行 的 函数 栈 。 


3.14 练习 


2 >] 3-1 


编写 一 个 函数 right_Jjustify ， 接 收 一 个 字符 串 形 参 s ， 并 打印 出 
足够 的 前 导 空 白 ， 以 达到 最 后 一 个 字符 显示 在 第 70 列 上 。 


>>> right_justify('monty' ) 
monty 


提示 : 可 以 利用 字 Sa eae 另外 ，Python 提 供 了 一 
个 内 置 名 为 len 的 函数 ， 一 个 字符 串 的 长 度 ， 所 以 len('allen') 
的 值 是 5。 





练习 3-2 


函数 对 象 是 一 个 值 ， 可 以 将 它 赋 值 给 变量 ， 或 者 作为 实 参 传递 。 例 
如 ，do_twice 是 一 个 函数 ， 接 收 一 个 函数 对 象 作为 实 参 ， 并 调用 它 两 
次 : 


def do_twice(f): 





下 面 是 一 个 使 用 do_twice 来 调用 一 个 print_spam 函数 两 次 的 示 
例 : 


def print_spam(): 
print('spam' ) 


do_twice(print_spam) 





1. 将 这 个 示例 存 入 脚本 中 并 测试 它 。 


2. 修改 do_twice ， 让 它 接 收 两 个 实 参 ， 一 个 是 函数 对 象 ， 力 一 个 
是 一 个 值 ， 它 会 调用 函数 对 象 两 次 ， 并 传 入 那个 值 作为 实 参 。 


3. 将 本 章 前 面 介绍 的 函数 print_twice 的 定义 复制 到 你 的 脚本 


4. 使 用 修改 版 的 do_twice 来 调用 print_twice 两 次 ， 并 传 入 实 


参 'spam' 。 


5. 定义 一 个 新 的 函数 do_four ， 接 收 一 个 函数 对 象 与 一 个 值 ， 使 
用 这 个 值 作为 实 参 调用 函数 4 次 。 这 个 函数 的 函数 体 应 该 只 有 2 条 语句 ， 
而 不 是 4 条 。 


解答 : http://thinkpython2.com/code/do_four.py。 
练习 3-3 


注意 : 这 个 练习 应 该 只 用 语句 和 我 们 已 经 学 过 的 其 他 语言 特性 实 
现 。 


1. 编写 一 个 函数 ， 绘 制 如 下 的 表格 : 

















提示 : HEERE Me, AT DEAE Sor hs A A: 


默认 情况 下 ，Print 会 目 动 换行 ， 如 果 你 想 改变 这 一 行为 ， 在 结尾 
打印 一 个 空格 ， 可 以 这 样 做 : 


print('+', end=' ') 
print('-') 





这 两 条 语句 的 输出 是 '+ -" 





不 市 参数 的 print 语句 会 结束 当前 行 并 开始 下 一 行 。 





2. 编写 一 个 函数 绘制 类 似 的 表格 ， 但 有 4 行 4 列 。 


解答 : hhttp://thinkpython2.com/code/grid.py. "Sit: 这 个 练习 基于 
Oualline 的 《实践 C 编 程 》 第 3 版 (O'Reilly Media, 1997) 中 的 一 个 示 
例 。 





[1] 这 一 段 中 讲 的 参数 有 两 种 : 函数 定义 里 的 形 参 (parameter) ， 以 及 
调用 函数 时 传 入 的 实 参 Cargument) ， 这 里 两 种 是 有 区 分 的 。 一 一 译 者 
注 


[2] 调用 时 传 入 的 参数 称 为 实 参 (argument) 。 一 一 详 者 注 


Fae RUR: 接口 设计 


本 章 通 过 一 个 案例 研究 来 展示 设计 互相 配合 的 函数 的 过 程 。 





本 章 介绍 turtle 模块 ， 通 过 这 个 模块 可 以 使 用 乌龟 图 形 来 创造 图 
像 。 大 多 数 Python 安 装 包 里 都 包含 了 turtle 模块 ， 但 是 如 果 使 用 的 是 
PythonAnywhere， 则 不 能 直接 运行 乌 包 示例 (至少 在 我 写本 这 本 书 的 时 
候 还 不 行 ) 。 











如 果 你 已 经 在 电脑 上 安装 了 Python， 应 该 可 以 运行 本 章 的 示例 。 否 
则 ， 现 在 就 是 安装 Python 的 好 时 机 。 我 在 http:Wtinyurl.comy/thinkpython2e 
上 写 了 安装 指南 。 


本 章 的 代码 示例 可 以 从 http://thinkpython2.com/code/polygon.py 下 
载 。 


4.1 turtle 模块 


要 检查 是 否 已 经 安装 了 turtle 模块 ， 可 以 打开 Python 解释 器 并 在 
其 中 输入 : 





>>> import turtle 
>>> bob = turtle. Turtle() 








运行 这 段 代 码 时 ， 应 该 会 创建 一 个 新 窗口 ， 里 面 有 一 个 小 箭头 代表 
乌 怨 。 请 关闭 窗口 。 


创建 一 个 文件 mypolygon.py ， 并 输入 如 下 代码 : 


import tutle 
bob = turtle. Turtle() 
print (bob) 


turtle.mainloop() 





turtle 模块 《以 小 写 t 开 头 ) 提供 一 个 叫 作 Turtle 的 函数 (以 大 
写 T 开 头 ) ， 它 会 创建 一 个 Turtle 对 象 ， 我 们 将 其 赋值 到 bob 变量 。 打 
印 bob 会 得 到 类 似 下 面 的 输出 : 


<turtle.Turtle object at @xb7bfbf4c> 


这 意味 着 bob 变量 引用 着 在 turle 模块 中 定义 的 Turtle 类 型 的 一 
个 对 象 。 





mainloop 告诉 窗口 去 等 得 用 户 进行 条 些 操作 ， 虽 然 现 在 除了 关闭 
窗口 之 外 ， 并 没有 提供 给 用 户 多 少 有 用 的 操作 。 





创建 好 一 个 乌龟 《Turle) 之 后 ， 就 可 以 调用 它 的 一 个 方法 
(method) 来 在 窗口 中 移动 。 方 法 和 函数 类 似 ， 但 是 使 用 的 语法 略 有 不 
同 。 例 如 ， 要 让 乌龟 辣 前 移动 : 


bob.fd(166) 


这 个 方法 fd 和 我 们 称 为 bob 的 马 怨 对 象 是 关联 的 。 调 用 方法 和 发 
出 一 个 请 求 类 似 : 你 是 在 请 求 bob = HIH Z) 








fd 的 参数 是 移动 的 距离 ， 以 像素 〈pixel) 为 单位 ， 所 以 实际 移动 
的 距离 依赖 于 显示 器 的 分 辩 率 。 


Turtle 对 象 的 其 他 方法 包括 bk ( 用 于 前 进 和 后 退 ) 、1t 和 rt (用 
于 左 转 和 右 转 ) 。1t 和 rt 的 参数 是 旋转 的 角度 ， 单 位 是 度 。 


另外 ， 每 只 乌龟 都 拿 着 一 只 笔 ， 可 以 朝 上 或 者 绷 下 ; AERA, J 
会 绘制 出 走 过 的 路 迹 。 方 法 pu 和 pd 分 别 表示 “ 笔 朝 上 ”(pen up) 和 “ 笔 
#H F” (pen down) 。 


敬 要 男 一 个 朝 右 的 角 ， 在 程序 中 (建立 bob 实例 之 后 ， 调 
用 mainloop 之 前 ) 添加 如 下 代码 : 
bob. fd(160) 


bob.1t(90) 
bob.fd(166) 


| 


运行 这 个 程序 时 ， 将 会 看 到 bob 先 同 东 走 ， 再 问 北 走 ， 里 后 留 下 两 
条 线段 。 








现在 试 大 修改 程序 ， 夯 出 一 个 正方 形 来 。 在 成 功 之 前 请 不 要 继续 ! 


4.2 人 简单 重复 





你 可 能 会 写 下 如 下 代码 : 


bob.fd(166) 
bob.1t(90) 


bob.fd(166) 
bob.1t(90) 


bob. fd(10@) 
bob.1t(90) 


bob.fd(166) 





使 用 for 语句 ， 可 以 更 紧凑 地 实现 同样 功能 。 把 下 面 的 例子 加 
到 mypolygon.py 中 ， 并 再 运行 一 次 : 


for i in range(4): 
print('Hello!') 





可 能 会 看 到 如 下 输出 : 





这 是 for 语句 的 最 简单 用 法 ， 后 面 我 们 会 看 到 更 多 的 用 法 。 但 这 样 
己 经 足够 重 写 刚 才 的 画 正 方形 的 程序 了 。 请 重 写 后 再 接着 阅读 。 


下 面 是 使 用 for 语句 绘制 正方 形 的 程序 : 


for i in range(4): 
bob.fd(10@) 


bob.1t(90) 





for 语句 的 语法 和 函数 定义 类 似 。 它 也 有 一 个 以 冒号 结束 的 语句 
头 ， 并 有 一 个 缩 进 的 语句 体 。 语 句 体 可 以 包含 任意 数量 的 语句 。 


for 语句 也 称 为 循环 Coop) ， 因 为 执行 流程 会 过 历 语 句 体 ， 之 后 
从 语句 体 的 最 开头 重新 循环 执行 。 在 这 个 例子 里 ， 语 句 体 执行 了 4 次 。 





这 个 版 本 的 代码 和 之 前 的 绘制 正方 形 的 代码 其 实 还 稍 有 不 同 ， 因 为 
在 最 后 一 次 循环 后 它 多 做 了 一 次 左 转 。 多 余 的 左 转 稍 微 多 消耗 了 点 时 
间 ， 但 因为 每 次 循环 做 的 事情 都 一 样 ， 也 让 代码 更 简练 。 这 个 版 本 的 代 
码 还 有 一 个 效果 ， 程 序 执行 完 之 后 ， 马 鱼 会 回归 到 初始 的 位 置 ， 并 朝向 
初始 相同 的 方 同 。 





4.3 ”练习 





下 面 是 一 系列 使 用 乌龟 世界 的 练习 。 它 们 力求 有 趣 ， 但 也 包含 着 某 
些 寅 意 。 做 这 些 练习 时 ， 可 以 猜想 一 下 其 宛 意 。 








在 接 下 来 的 章节 中 有 这 些 练习 的 解答 ， 所 以 在 完成 〈 或 着 至 少 答 试 
过 ) 之 前 ， 请 移 别 继续 阅读 。 


1， 写 一 个 函数 square ， 接 受 一 个 形 参 t ， 用 来 表示 一 只 乌 怨 。 利 
用 乌龟 来 画 一 个 正方 形 。 


一 个 函数 调用 传 入 bob 作为 实 参 来 调用 square 函数 ， 并 再 运行 


2. 给 square 函数 再 添加 一 个 形 参 length 。 修 改 函 数 内 容 ， 保 证 
正方 形 的 长 度 是 length ， 并 修改 函数 调用 以 提供 这 第 二 个 实 参 。 再 运 
一 遍 程序 。 使 用 不 同 的 length 值 测试 你 的 程序 。 


3. 复制 square 函数 ， 8 名 为 polygon 。 再 添加 一 个 形 参 n 并 修 
改 函 数 体 以 绘制 一 个 正 n 边 形 。 提 示 : En 边 形 的 拐角 是 360/n E. 


4. 写 一 个 函数 circle 接受 代表 乌龟 的 形 参 t ， 以 及 表示 半径 的 形 
参 r ， 并 使 用 合适 的 长 度 和 边 数 调用 polygon 画 一 个 近似 的 圆 。 使 用 不 
同 的 r 值 来 测试 你 的 函数 。 


提示 : 思考 圆 的 周 长 (circumference) ， 并 保证 length * n= 


circumference . 


另 一 个 提示 : 如 果 你 觉得 bob 太 慢 ， 可 以 修改 bob.delay 来 加 
速 。bob .delay 代表 每 次 行动 之 间 的 停顿 ， 单 位 是 秒 。bob .delay = 
6.61 应 该 能 让 它 跑 得 足够 快 。 





5. 给 circle 函数 写 一 个 更 通用 的 版 本 ， 称 为 arc 。 增 加 一 个 形 参 
angle ， 用 来 表示 画 的 圆 弧 的 大 小 。 这 里 angle 的 单位 是 度数 ， 所 以 
当 arc=366 时 ， 则 会 画 一 个 整 圆 。 





44 封装 


第 一 个 练习 要 求 把 画 正方 形 的 代码 放 到 一 个 函数 定义 中 ， 并 将 乌 凶 
bob 作为 实 参 传 入 ， 调 用 该 函数 。 下 面 是 一 个 解答 : 


def square(t): 
for i in range(4): 
t.fd(100) 
t.1t(90) 


square(bob) 








最 内 侧 的 语句 ，fd 和 1t BHE SPR, Rae etefor 语句 的 
语句 体内 部 ， 而 for 语句 在 函数 定义 的 函数 体内 部 。 最 后 一 
行 ，square(bob) ， 又 重新 从 左 侧 开始 而 没有 缩 进 ， 这 表明 for 语句 和 
square 函数 的 定义 都 已 经 结 


在 函数 体 中 ，t 引用 的 乌龟 和 bob 引用 的 相同 ， 所 以 t.1t(98) 和 
直接 调用 bob. lt(96) 是 一 样 的 效果 。 在 这 种 情况 下 为 什么 不 直接 把 形 
参 写 为 bob 呢 ? 原因 是 t 可 以 是 任何 乌龟 ， 而 不 仅仅 是 bob ， 所 以 可 以 
再 新 建 一 只 乌龟 ， 并 将 它 作为 参数 传 入 到 square 函数 : 


alice = Turtle() 
square(alice) 


把 一 段 代 码 用 函数 包 里 起 来 ， 称 为 封装 Cencapsulation) 。 封 装 的 
一 个 好 处 是 ， 它 给 这 段 代码 一 个 有 意义 的 名 称 ， 增 加 了 可 读 性 。 另 一 个 





好 处 是 ， 当 重复 使 用 这 段 代 码 时 ， 调 用 一 次 函数 比 复制 粘贴 代码 要 简易 
得 多 ! 


45 ZM 


下 一 步 是 给 square 函数 添加 一 个 length 参数 。 这 里 是 一 个 解决 方 
案 ; 


def square(t, length): 
for i in range(4): 
t.fd(length) 
t.1t(90) 


square(bob, 100) 





给 函数 添加 参数 的 过 程 称 为 泛 化 〈generalization) » ALINE Sik ew 
数 变 得 更 通用 : 在 之 前 的 版 本 中 ， 正 方形 总 是 一 个 大 小 ， 而 新 的 版 本 
中 ， 可 以 是 任意 大 小 。 


一 步 也 是 一 次 泛 化 。 我 们 不 再 只 绘制 正方 形 ， 而 是 可 以 绘制 任意 
边 数 的 多 边 形 。 这 里 是 一 个 方案 : 


def polygon(t, n, length): 
angle = 360 / n 
for i in range(n): 
t.fd(length) 
t.lt(angle) 


polygon(bob, 7, 70) 





这 个 例子 绘制 一 个 7 边 形 ， 边 长 是 70。 


如 果 使 用 的 是 Python 2， 那 么 angle 的 值 可 能 会 因为 整数 除法 而 错 


误 。 一 个 简单 的 解决 办 法 是 使 用 angle = 360.0 / n 。 因 为 分 子 是 一 
个 浮 点 数 ， 所 以 结果 也 会 是 浮 点 数 。 











如 果 函 数 的 形 参 比较 多 ， 很 容易 忘掉 每 一 个 具体 是 什么 ， 或 者 忘掉 
它们 的 顺序 。 所 以 在 Python 中 ， 调 用 函数 时 可 以 加 上 形 参 名 称 ， 这 样 是 
合法 的 ， 并 且 有 时 候 会 有 帮助 : 


polygon(bob, n=7, length=70) 


些 参数 被 称 为 关键 词 参数 (keyword argument) ， 因 为 它们 使 
FAs S 的 名 称 调 用 〈 请 别 和 while 与 def 之 类 的 
Python KiE FIE) 。 





这 个 语法 使 得 程序 更 加 可 读 。 它 也 同样 提示 了 我 们 实 参 和 形 参 的 工 
ETA: 当 调 用 函数 时 ， 实 参 传 入 并 赋值 给 形 参 。 


46 接口 设计 


下 一 i aan 函数 ， 接 受 形 参 r ， nei 下 
面 是 一 个 简单 的 例子 ， 通 过 调用 polygon 函数 画 50 边 的 多 边 


import math 


def circle(t, r): 
circumference = 2 * math.pi * r 
n = 50 
length = circumference / n 
polygon(t, n, length) 





第 一 行 计算 半径 为 r 的 圆 的 周 长 ， 使 用 公式 2rr 。 因 为 我 们 使 用 的 
是 math.pi ， 所 以 需要 先导 入 math 模块 。 依 照 惯例 ，import 语句 一 般 
都 放 在 脚本 开头 。 


n 是 我 们 用 于 近似 画 圆 的 多 边 形 的 边 数 ， 所 以 length 是 每 个 边 的 
长 度 。 因 此 ，polygon 画 出 一 个 50 边 形 ， 近 似 于 一 个 半径 为 r 的 圆 。 











这 个 解决 方案 的 缺点 之 一 是 n 是 一 个 第 量 ， 因 此 对 于 很 大 的 圆 ， 多 
边 形 的 边线 太 长 ， 而 对 于 小 贺 ， 我 们 又 浪费 时 间 去 画 过 短 的 边线 。 人 解决 
办 法 之 一 是 泛 化 这 个 函数 ， 加 上 形 参 n 。 这 样 可 以 给 用 户 ( 调 用 circle 
RBI AD 更 多 的 控制 选择 ， 但 接口 就 不 那么 清晰 整洁 了 。 








函数 的 接口 是 如 何 使 用 它 的 概要 说 明 : a E 参 数 ? 这 个 函数 
做 什么 ? 它 的 返回 值 是 什么 ? 我们 说 一 个 接口 “整洁 ”(clean) ， pen 
能 够 让 调用 者 完成 所 想 的 事情 ， DR ae ot 。 


在 这 个 例子 里 ，r 属于 函数 的 接口 ， 因 为 它 指定 了 所 画 的 圆 的 基本 
属性 。 相 对 地 ，n 则 不 那么 适合 ， 因 为 它 说 明 的 是 如 何 画 圆 的 细节 信 


CI 


所 以 与 其 弄 乱 接口 ， 不 如 在 代码 内 部 根据 周 长 来 选择 合适 的 n 值 : 


def circle(t, r): 
circumference = 2 * math.pi * r 


n = int(circumference / 3) +1 


length = circumference / n 
polygon(t, n, length) 





现在 多 边 形 的 边 数 是 一 个 接近 circumferencey/3 的 整数 ， 所 以 每 
个 边 长 近似 是 3， 已 经 小 到 足够 画 出 好 看 的 圆 形 ， 但 又 足够 大 到 不 影响 
画 线 效率 ， 并 且 可 接受 任何 尺寸 的 圆 。 


4.7 HRY 


当 我 写 circle 函数 时 ， 我 可 以 复 用 polygon ， 因 为 边 数 很 多 的 正 
多 边 形 是 圆 的 很 好 的 近似 。 但 是 arc 则 并 不 那么 容易 对 付 ; 我 们 不 能 使 
用 polygon 或 者 circle 来 画 圆 弧 。 


换个 办 法 ， 可 以 先 复制 一 个 polygon 函数 ， 再 通过 修改 得 到 arc K 
数 。 结 有 果 可 能 类 似 下 面 的 示例 : 


def arc(t, r, angle): 
arc_length = 2 * math.pi * r * angle / 360 
n = int(arc_length / 3) + 1 
step_length = arc_length / n 
step_angle = angle / n 


for i in range(n): 
t.fd(step_length) 
t.1t(step_angle) 





这 个 函数 的 第 二 部 分 很 像 polygon 的 实现 ， 但 如 果 不 修改 polygon 
的 接口 ， 无 法 直接 复 用 。 我 们 也 可 以 泛 化 polygon 函数 以 接受 第 三 个 参 
数 表示 圆 弧 的 角度 ， 但 那样 的 话 polygon (ZAE) 就 不 是 合适 的 名 称 
J! 所 以 ， 我 们 将 这 个 更 泛 化 的 函数 称 为 polyline 〈 多 边线 ) : 
def polyline(t, n, length, angle): 


for i in range(n): 
t.fd(length) 


t.1t(angle) 





现在 我 们 可 以 重 写 polygon 和 arc ， 让 它们 调用 polyline : 


def polygon(t, n, length): 
angle = 360.0 / n 
polyline(t, n, length, angle) 


def arc(t, r, angle): 
arc_length = 2 * math.pi * r * angle / 360 


n = int(arc_length / 3) + 1 

step_length = arc_length / n 

step_angle = float(angle) / n 
polyline(t, n, step length, step angle) 





最 后 ， 我 们 可 以 重 写 circle ， 改 为 调用 arc : 


def circle(t, r): 
arc(t, r, 360) 





这 个 过 程 一 一 重新 组 织 程序 ， 以 改善 接口 ， 提 高 代码 复 用 一 一 被 称 
为 重 构 Crefactoring) 。 在 这 个 例子 里 ， 我 们 注意 到 arc 和 polygon 中 





有 类 似 的 代码 ， 因 此 我 们 把 它们 的 共同 之 处 “ 重 构 出 来 ”抽取 
到 polyline 函数 中 。 


如 有 果 我 们 早早 计划 ， 可 能 会 直接 先 写 下 polyline ， 也 就 避免 了 重 
构 ， 但 实际 上 在 工程 开始 时 我 们 往往 并 没有 足够 的 信息 去 完美 设计 所 有 
的 接口 。 开 始 编码 之 后 ， 你 会 更 了 解 面 对 的 问题 。 有 时 候 ， 重 构 正 意味 
着 你 在 编程 中 掌握 了 一 些 新 的 东西 。 




















48 —PSF Riz 

开发 计划 (development plan) 是 写 程序 的 过 程 。 本 章 的 案例 分 析 
中 ， 我 们 使 用 的 过 程 是 “封装 和 泛 化 >”。 这 个 过 程 的 具体 步骤 是 : 

1. 最 开始 写 一 些小 程序 ， 而 不 需要 函数 定义 。 


2. 一 旦 程序 成 功 运 行 ， 识 别 出 其 中 一 段 完 整 的 部 分 ， 将 它 封 装 到 
一 个 函数 中 ， 并 加 以 命名 。 


3. 泛 化 这 个 函数 ， 添 加 合适 的 形 参 。 


4. 重复 步骤 1 到 步骤 3， 直 到 得 到 一 组 可 行 的 函数 。 复 制 粘贴 代 
码 ， 以 避免 重复 输入 《以 及 重复 调试 ) 。 


5. 寻找 可 以 使 用 重 构 来 改善 程序 的 机 会 。 例 如 ， 如 果 发 现 程序 中 
几 处 地 方 有 相似 的 代码 ， 可 以 考虑 将 它们 抽取 出 来 做 一 个 合适 的 通用 函 
数 。 

这 个 过 程 也 有 一 些 缺 点 一 一 我 们 会 在 后 面 看 到 其 他 方式 一 一 但 如 果 
在 开始 编程 时 不 清楚 如 何 将 程序 分 成 适合 的 函数 ， 这 样 做 会 带 来 帮助 。 
这 个 方法 能 让 你 一 过 开发 二 这 估计 


49 ”文档 字符 串 


文档 字符 串 (docstring) 是 在 函数 开头 用 来 解释 其 接口 的 字符 串 
(doc 是 “文档 ”documentation 的 缩写 ) 。 下 面 是 一 个 示例 : 


def polyline(t, n, length, angle): 
"""Draws n line segments with the given length and 
angle (in degrees) between them. t is a turtle. 


for i in range(n): 
t.fd(length) 
t.1t(angle) 





依照 惯例 ， 所 有 的 文档 字符 串 都 使 用 三 引号 括 起 来 。 三 引号 字符 串 
又 称 为 多 行 字符 串 ， 因 为 三 引号 多 许字 符 串 跨行 表示 。 








文档 字符 串 很 简洁 ， 但 已 经 包含 了 其 他 人 需要 知道 的 关于 函数 的 基 
本 信息 。 它 简明 地 解释 了 函数 是 做 什么 的 〈 而 不 涉及 如 何 实现 的 细 
W) 。 它 解释 了 每 个 形 参 对 函数 行为 的 影响 效果 以 及 每 个 形 参 应 有 的 类 
型 《如 果 其 类 型 并 不 显而易见 ) 。 


编写 这 类 文档 是 接口 设计 的 重要 部 分 。 一 个 设计 民 好 的 接口 ， 也 应 
当 很 简单 就 能 解释 清楚 ， 如 果 你 发 现 解释 一 个 函数 很 困难 ， 很 可 能 表示 
该 接口 有 改进 的 空间 。 


4.10 ”调试 


函数 的 接口 ， 作 用 就 像 是 函数 和 调用 者 之 间 签 订 的 一 个 合同 。 调 用 
者 同意 提供 东 些 参数 ， 而 函数 则 同意 使 用 这 些 参数 做 茶 种 工作 。 





例如 ，polyline 需要 4 个 参数 : t 必须 是 一 个 Turtle; n 必须 是 整 
数 ; length 应 当 是 个 正 数 ， 而 angle 则 必须 是 一 个 数字 ， 并 且 按 照度 
数 来 理解 。 


这 些 需求 被 称 为 前 置 条 件 ， 因 为 它们 应 当 在 函数 开始 执行 之 前 就 
保证 为 真 。 相 对 地 ， 函 数 结束 的 时 候 需 要 满足 的 条 件 称 为 后 置 条 件 。 
后 置 条 件 包 含 了 函数 预期 的 效果 《如 画 出 线段 ) 以 及 任何 副作用 《如 移 
动 乌 怨 或 者 引起 其 他 改变 ) 。 





满足 前 置 条 件 是 调用 者 的 职责 。 如 果 调 用 者 违反 了 一 个 《文档 说 明 
清晰 的 ! ) 前 置 条 件 ， 因 而 导致 函数 没有 正确 运行 ， 则 bug 是 在 调用 
者 ， 而 不 在 函数 本 喘 。 








如 果 前 置 条 件 已 经 满足 ， 但 后 置 条 件 没有 满足 ， 那 么 bug 就 出 现在 
函数 本 身 。 如 果 前 置 和 后 置 前 置 都 定义 清晰 ， 可 以 帮助 调试 。 











4.11 NEK 


方法 (method) : 与 茶 个 对 象 相关 联 的 一 个 函数 ， 使 用 句点 表达 
式 调用 。 


循环 Coop) : 程序 中 的 一 个 片段 ， 可 以 重复 运行 。 
封装 Cencapsulation) : 将 一 组 语句 转换 为 函数 定义 的 过 程 。 


泛 化 (generalization) : 将 一 些 不 必要 的 具体 值 〈 如 一 个 数字 ) 蔡 
换 为 合适 的 通用 参数 或 变量 的 过 程 。 


关键 词 参数 (keyword argument) : 调用 函数 时 ， 附 带 了 参数 名 称 
《作为 一 个 “关键 词 ? 来 使 用 ) 的 参数 。 


接口 (interface) : 描述 函数 如 何 使 用 的 说 明 。 包 括 函 数 的 名 称 
以 及 形 参 与 返回 值 的 说 明 。 


重 构 (refactoring) : 修改 代码 并 改善 施 数 的 接口 以 及 代码 质量 的 


开发 计划 (development plan) : 写 程序 的 过 程 。 


文档 字符 串 Cdocstring) : 在 函数 定义 开始 处 出 现 的 用 于 说 明 函 数 
接口 的 字符 串 。 


前 置 条 件 (precondition) : 在 函数 调用 开始 前 应 当 满 足 的 条 件 。 


后 置 条 件 Cpostcondition) : 在 函数 调用 结束 后 应 当 满 足 的 条 件 。 


4.12 练习 
练习 4-1 
在 http:/thinkpython2.com/code/polygon.py 下 载 本 章 的 代码 。 


1. 画 一 个 栈 图 来 显示 函数 circle(bob，radius) 运行 时 的 程序 状 
。 你 可 以 手动 计算 ， 或 者 在 代码 中 添加 一 些 print 语句 。 


or 


2. 在 4.7 节 中 的 arc 函数 并 不 准确 ， 因 为 使 用 多 边 形 模拟 近似 圆 ， 
总 是 会 在 真实 的 圆 之 外 。 因 此 ，Turtle 画 完 线 之 后 会 停 在 偏离 正确 的 目 
标 几 个 像素 的 地 方 。 我 的 解决 方案 里 展示 了 一 种 方法 可 以 减少 这 种 错误 
的 效果 。 阅 读 代 码 并 考虑 是 否 合理 。 如 果 你 自己 画图 ， 可 能 会 发 现 它 是 








如 何 生效 的 。 


练习 4-2 


写 一 组 合适 的 通用 函数 ， 用 来 画 出 图 4-1 所 示 的 花 宁 图 案 。 


解答 : http://thinkpython2.com/code/flower.py， 男 外 也 需要 
http://thinkpython2.com/code/ polygon.py. 


a 


图 4-1 人 花灯 图 


练习 4-3 
适 的 通用 函数 ， 用 来 画 出 图 4-2 所 示 的 图 形 。 


解答 : http://thinkpython2.com/code/pie.py。 


BEE 


图 4-2 HA 


练习 4-4 
字母 表 中 的 字母 可 以 使 用 一 些 基 本 元 素来 构成 ， 如 横 线 、 竖 线 以 及 
一 些 曲线 。 设 计 一 个 字母 表 ， 可 以 使 用 最 少 的 基本 元 素 画 出 来 ， 并 编写 








函数 来 画 出 字母 。 


你 应 当 给 每 个 字母 单独 写 一 个 函数 ， 名 称 为 draw_a 、draw_b 等 
并 把 这 些 函 数 放 到 letters .py 文件 中 。 可 以 从 
http://thinkpython2.com/code/typewriter.py 下 载 一 个 “ 乌 包 打字 机 ”程序 来 
帮助 测试 你 的 代码 。 


你 可 以 在 http://thinkpython2.com/code/letters.py 获 得 解答 ， 男 外 也 需 
要 http://thinkpython2.com/ code/polygon.py。 


练习 4-5 


在 http:/en.wikipedia.org/wikiSpiral 疝 读 关 于 螺旋 线 (spiral) 的 信 
Is 接着 编写 一 段 程序 来 男 出 阿 基 米 德 螺旋 《或 者 其 他 的 某 种 螺旋 





解答 : http://thinkpython2.com/code/spiral.py。 


第 5 革 AP AA 








本 章 的 主要 话题 是 if 表达 式 ， 它 根据 程序 的 状态 执行 不 同 的 代 
码 。 但 首先 我 想 要 介绍 两 个 新 操作 符 : 问 下 取 整 除法 操作 符 和 求 模 操作 
FF o 


5.1 问 下 取 整 除法 操作 符 和 求 模 操作 从 


问 下 取 整 除法 操作 符 〈// ) 对 两 个 数 进 行 除法 运算 ， i 
得 到 一 个 整数 。 例 如 ,假设 一 个 电影 的 播放 时 长 为 105 分 钟 ， 你 可 
想 知 道 按 小 时 算 这 是 多 长 。 传 统 的 除法 会 得 到 一 个 浮 点 数 : 


>>> minutes = 105 
>>> minutes / 60 


1.75 








但 是 ， 我 们 在 写 小 时 数 时 通常 并 不 用 小 数 点 。 向 下 取 整 除法 ， 则 丢 
弃 小 数 部 分 ， 得 到 整数 的 小 时 数 : 


>>> minutes = 105 

>>> hours = minutes // 60 
>>> hours 

1 





要 求 得 余数 ， 可 以 从 分 钟 数 中 减 去 1 小 时 : 


>>> remainder = minutes - hours * 60 
>>> remainder 


45 





一 种 办 法 是 使 用 求 模 操作 符 〈% ) 将 两 个 数 相 除 ， 得 到 余数 : 


>>> remainder = minutes % 60 
>>> remainder 
45 


pO 


求 模 操作 符 其 实 有 很 多 实际 用 途 。 例 如 ， 可 以 用 它 来 检测 一 个 数 是 
不 是 另 一 个 的 倍数 一 一 如 果 x % y 是 0， 则 x 可 以 被 y 整除 。 


另外 ， 也 可 以 用 它 来 获取 一 个 数 后 一 位 或 后 几 位 数字 。 例 如 ，X % 
10 可 以 得 到 x 的 个 位 数 〈10 进 制 ) 。 类 似 地 ，x % 100 可 以 获得 最 后 
两 位 数 。 





如 琳 使 用 的 是 Python 2， 除 法 机 制 会 有 所 不 同 。 除 法 操作 符 “〈/) 在 
两 个 操作 数 都 是 整数 的 情况 下 ， 实 际 进行 的 是 癌 下 取 整 除法 操作 ， 而 当 
两 个 操作 数 中 有 一 个 是 浮上 点数 时 ， 则 进行 的 是 译 点 数 除法 。 





5.2 AMAR AIATL 


布尔 表达 式 是 值 为 真 或 假 的 表达 式 。 下 面 的 例子 中 使 用 了 == 操作 
符 ， 来 比较 两 个 操作 对 象 是 否 相等 。 如 果 相 等 ， 则 得 True ， 人 否则 


是 False : 








True 和 False 是 类 型 bool 的 两 个 特殊 值 : 它们 不 是 字符 串 : 


>>> type(True) 
<class 'bool'> 
>>> type(False) 
<class 'bool'> 





== 操作 符 是 一 个 关系 操作 符 ;其 他 的 关系 操作 符 有 : 


x 不 等 于 y 
x 比 y 大 
x 比 y 小 


x 大 于 或 等 于 y 
x 小 于 或 等 于 y 





虽然 你 可 能 对 这 些 操作 已 经 熟悉 ， 但 是 Python 的 符 写 和 数学 符号 还 
是 有 些 区 别 的 。 最 第 见 的 错误 是 使 用 单 等 号 (= ) 而 不 是 双 等 写 ( 





) 。 请 记 住 = 是 一 个 赋值 操作 符 ， 而 == 是 一 个 关系 操作 符 。 另 外 ， 不 存 
在 =< 或 者 => 这 样 的 操作 符 。 


5.3 ERIEN 


逻辑 操作 符 有 3 个 : and, or 和 not 。 这 些 操作 符 的 语义 (意义 ) 
和 它们 在 英语 中 的 意思 差不多 。 例 如 ，x > 6 and x < 10 只 有 当 x tk 
OAH. 比 10 小 时 才 为 真 。 





n%2 == 6 or n%3 ==8 ， 当 其 中 任意 一 个 条 件 为 真 时 为 真 ， 也 就 
是 说 ， 数 n 可 以 被 2 或 3 整除 都 可 以 。 





最 后 ，not 操作 符 可 以 否定 一 个 布尔 表达 式 ， 所 以 not (x > y) 
在 x > y 为 假 时 为 真 ， 即 当 x 小 于 等 于 y 时 真 。 





严格 地 说 ， 人 逻辑 操 作 符 的 操作 对 象 应 该 都 是 布尔 表达 式 ， 但 是 
Python 并 不 那么 严格 。 任 何 非 0 的 数 都 被 解释 为 True 。 


>>> 42 and True 
True 


这 种 灵活 性 可 能 会 很 有 有 用， 但 有 时 候 也 会 带 来 一 些小 困惑 。 你 可 能 
应 该 避免 使 用 它 《 除 非 你 很 确切 地 知道 自己 在 做 什么 ) 。 





5.4 条 件 执行 


为 了 编写 有 用 的 程序 ， 我 们 几乎 总 是 需要 检查 条 件 并 据 此 改变 程序 
的 行为 的 能 力 。 条 件 语句 给 了 我 们 这 种 能 力 。 最 简单 的 形式 是 if 表达 
式 : 


if x > @: 
print('x is positive') 


if 之 后 的 布尔 表达 式 补 称 为 条 件 (condition〉。 如 果 它 为 真 ， 则 
之 后 缩 进 的 语句 会 运行 。 人 否则 ， 什 么 都 不 发 生 。 











if 表达 式 的 结构 和 函数 定义 一 样 : 一 个 语句 头 ， 接 着 是 缩 进 的 语 
句 体 。 这 种 类 型 的 语句 称 为 复合 语句 。 








语句 体 中 出 现 的 语句 数量 并 没有 限制 ， 但 是 最 少 需 要 一 行 。 偶 尔 可 
能 会 遇 到 需要 一 个 语句 体 什 么 都 不 做 〈 通 常 是 标记 一 个 你 还 没有 来 得 及 
写 的 代码 的 位 置 ) 。 这 个 时 候 ， 可 以 使 用 pass 语句 。pass 语句 什么 都 
不 做 。 




















# TODO: 需要 处 理 负 值 的 情况 ! 











5.5 选择 执行 


if 语句 的 第 二 种 形式 是 选择 执行 ， 这 种 形式 下 ， 有 两 种 可 能 ， 
而 if 的 条 件 决定 哪 一 种 运行 。 语 法 看 起 来 是 这 样 的 : 
if x%2 == @: 


print('x is even') 
else: 


print('x is odd') 





如 果 x 除 以 2 的 余数 是 0， 则 我 们 知道 x 是 偶数 (even) ， 并 且 程 序 
会 显示 合适 的 消息 even' 。 如 果 条 件 为 假 ， 则 第 二 段 语 名 会 运行 。 因 为 
条 件 必 定 是 真 假 之 一 ， 所 以 必然 只 会 有 一 段 语 句 运行 。 这 两 段 不 同 的 语 
句 称 为 分 文 〈branch) ， 因 为 它们 是 程序 执行 流程 中 的 两 个 文 流 。 











5.6 条件 链 


有 时 候 有 超过 两 种 的 可 能 ， 所 以 我 们 需要 更 多 的 分 支 。 表 达 这 种 计 
算 的 一 种 方式 是 条 件 链 (chained conditional) : 


if x < y: 

print('x is less than y') 
elif x > y: 

print('x is greater than y') 


else: 
print('x and y are equal’) 





elif 是 “else 放 ”的 缩写 。， 和 之 前 一 样 ， 只 有 一 个 分 支 会 运行 。elif 
语句 的 数量 没有 限制 。 如 果 有 一 个 else 语句 ， 则 它 必 须 放 在 最 后 。 但 
也 可 以 没有 else 语句 。 
if choice == ‘a' 

draw_a() 


elif choice == 'b' 
draw_b() 


elif choice == 'c' 
draw_c() 





个 条 件 都 按 顺 序 检 查 。 如 采 第 一 个 是 false， 则 检查 下 一 个 ， 依 此 
my 如 果 有 一 个 条 件 为 真 ， 则 运行 相应 的 分 文 ， 而 整个 语句 结束 。 即 
使 有 多 个 条 件 为 真 ， 也 只 有 第 一 个 为 真 的 分 支 会 运行 





57 HERE 


条 件 判断 可 以 再 税 套 条 件 判断 。 我 们 可 以 修改 前 一 节 中 的 示例 ， 如 
F: 





if x == y: 
print('x and y are equal') 
else: 


if x < y: 


print('x is less than y') 
else: 
print('x is greater than y') 





SMU MACE AAS ARAM. BOT MAI IEA). 
ede aie, Cee P O 
支 也 都 是 简单 语句 ， 虽 然 它 们 其 实 也 可 以 是 条 件 语句 。 








虽然 语句 的 缩 进 让 结构 非常 明晰 ， 但 风 套 条 件 语句 SR RE 
套 层 数 增多 而 变 得 非常 难以 阅读 。 应 该 尽量 避免 它 。 


逻辑 操作 符 第 第 能 够 用 来 简化 髋 套 条 件 语句 。 例 如 ， 我 们 可 以 将 下 
面 的 语句 丛 换 为 单独 的 一 个 条 件 : 


if O< x: 
if x < 10: 


print('x is a positive single-digit number. ') 





print 语句 只 有 在 两 个 条 件 语 名 都 通过 时 才 运 行 ， 所 以 我 们 可 以 使 


Hand 操作 符 达 到 相同 的 效果 : 


if ð < x and x < 10: 
print('x is a positive single-digit number. ') 





对 于 这 种 类 型 的 条 件 ，Python 还 提供 了 一 个 更 简洁 的 语法 : 


if Oð < x < 10: 
print('x is a positive single-digit number. ') 





5.8 递归 


函数 调用 另外 一 个 函数 是 合法 的 ; 函数 调用 目 己 也 是 合法 的 。 这 样 
做 有 什么 好 处 可 能 还 不 明显 ， 但 它 其 实 是 程序 能 做 的 最 神奇 的 事情 之 
。 例 如 ， 考 虑 下 面 的 函数 : 








def countdown(n): 
if n <= 0: 
print('Blastoff!') 
else: 


print(n) 
countdown(n - 1) 





如 果 n 是 0 或 负数 ， 它 会 输出 单词 "Blastoff!”， 其 他 情况 下 ， 它 会 输 
出 n ， 并 调用 一 个 名 为 countdown 的 函数 一 一 它 自 己 一 一 并 传 入 实 参 n- 
T 


我 们 调用 这 个 函数 时 会 及 生 什么 ? 


>>> countdown(3) 


countdown 的 执行 从 n=3 开始 ， 因 为 n 比 0 大 ， 所 以 会 输出 3， 并 接 
AWHEA G... 


countdown 的 执行 从 n=2 开始 ， 因 为 n 比 0 大 ， 所 以 会 输出 2， 
并 接着 调用 自己 .……… 


countdown 的 执行 从 n=1 开始 ， 因 为 n 比 0 大 ， 所 以 会 输出 
1， 并 接着 调用 目 己 .…….. 


countdown 的 执行 从 n=8 开始 ， 因 为 n 不 比 0 大 ， 所 以 会 
输出 单词 “Blastoff!'”， 并 返回 。 


接收 n=1 的 函数 countdown 返回 。 
接收 n=2 的 函数 countdown 返回 。 
接收 n=3 的 函数 countdown 返回 。 


然后 就 会 到 了 __main_ 函数 。 所 以 ， 全 部 的 输出 如 下 : 


3 
2 
1 
Blastoff! 


调用 自己 的 函数 称 为 递归 的 (recursive) 函数 ， 这 个 执行 的 过 程 叫 
作 递 归 (recursion)。 


另外 举 一 个 例子 ， 我 们 可 以 写 一 个 函数 打印 某 个 字符 串 n 次 。 


def print_n(s, n): 
if n <= @: 
return 


print(s) 
print_n(s, n-1) 








如 果 n <= 0, return 语句 会 直接 退出 当前 函数 。 执 行 流程 会 立即 
返回 到 调用 者 ， 之 后 的 语句 不 会 运行 。 


函数 另外 的 部 分 和 countdown 类 似 : 如 果 n 大 于 0， 它 会 打印 s 并 
且 调 用 自己 ， 以 再 进行 n -1 次 显示 s 的 操作 。 所 以 输出 的 行 数 是 1+(n 
-1), thifiten. 


对 于 这 样 简 单 的 例子 来 说 ， 可 能 使 用 for 循环 会 更 容易 。 但 我 们 会 
在 后 面 见 到 一 些 示 例 ， 使 用 for 循环 很 难 写 ， 但 使 用 递归 则 会 很 简单 ， 
所 以 早早 开始 了 解 递 归 是 件 好 事 。 


5.9 ”递归 函数 的 栈 图 


在 3.10 节 中 ， 我 们 使 用 一 个 栈 图 来 表示 程序 在 进行 函数 调用 时 的 状 
态 。 同 样 的 栈 图 ， 可 以 用 来 帮助 我 们 解释 递归 函数 。 


一 个 函数 每 次 被 调用 时 ，Python 会 创建 一 个 帧 (function frame) ， 
来 包含 函数 的 局 部 变量 和 参数 。 对 于 递归 函数 ， 栈 上 可 能 同时 存在 多 个 
函数 帧 。 


图 5-1 展 示 了 countdown 函数 在 n=3 调用 时 的 栈 图 。 
main 
countdown n —> 


countdown n 一 一 > 


HL 


countdown n— 1 


countdown he ae 


图 5-1 栈 图 


和 往常 一 样 ， 栈 的 顶端 是 _main_ 的 函数 帧 。 因 为 我 们 没有 
fE__main__ 函数 里 新 建 任何 变量 或 传 入 任何 参数 ， 所 以 它 是 空 的 。 


4 个 countdown KAMA AE Bin 值 。 最 底 端 的 栈 ， 其 n=6 , 
被 称 为 基准 情形 (base case) 。 因 为 它 不 再 进行 递归 调用 ， 所 以 后 面 没 
有 其 他 函数 帧 了 。 





作为 练习 ， 为 函数 print_n 男 一 个 栈 图 ， 其 调用 实 参 是 s = 
'Hello' 和 n=2 。 然 后 写 一 个 函数 do_n ， 接 受 一 个 函数 对 象 和 一 个 数 
字 n 作为 形 参 。 它 会 调用 给 定 的 函数 n 次 。 





5.10 ZIRH 


如 果 一 个 递归 永远 达 不 到 基准 情形 ， 则 它 会 永远 继续 递归 调用 ， 而 
程序 也 永 不 停止 。 这 个 现象 被 称 为 无 限 递归 ， 而 它 并 不 是 个 好 主意 。 
下 面 是 一 个 会 引起 无 限 递归 的 最 简单 函数 : 





def recurse(): 
recurse() 





在 大 多 数 程序 环境 中 ， 无 限 递归 的 函数 并 不 会 真 的 永远 执行 。 
Python 会 在 递归 深度 到 达 上 限时 报告 一 个 出 错 消 息 : 
File "<stdin>", line 2, in recurse 


File "<stdin>", line 2, in recurse 
File "<stdin>", line 2, in recurse 


File "<stdin>", line 2, in recurse 
RuntimeError: Maximum recursion depth exceeded 





这 个 调用 回溯 比 上 一 章 看 到 的 要 大 一 些 。 当 这 个 错误 发 生 时 ， 栈 上 
已 经 有 1000 个 recurse fi y ! 





如 果 你 不 小 必 写 出 了 一 个 无 限 循环 ， 请 复查 上 自己 的 函数 ， 确 认 里 面 
至 少 有 一 个 基准 情形 不 进行 递归 调用 。 如 末 已 经 有 了 一 个 基准 情形 ， 检 
但是 否 已 经 确保 在 运行 时 能 达到 它 。 





5.11 键盘 输入 


目前 为 止 我 们 写 过 的 程序 都 还 不 能 接收 用 户 的 输入 。 它 们 只 能 每 次 
做 相同 的 事情 。 


Python 提供 了 一 个 内 置 函 数 input 来 从 键盘 获取 输入 并 等 竺 用户 输 
入 一 些 东 西 。 当 用 户 按 下 回 车 键 ， 程序 会 恢复 运行 ， 而 且 input 则 通过 


字符 串 形 式 返 回 用 户 输入 的 内 容 。 在 Python 2 里 ， 这 个 函数 叫 


raw_input 。 





>>> text = input() 
Whate are you waiting for? 


>>> text 
Whate are you waiting for? 








FEMA AB RAHA ZH, CRIT EN “Meas fa eh, URAL ti 
望 他 们 输入 什么 。raw_input 函数 可 以 接受 一 个 参数 作为 提示 : 


>>> name = input('What...is your name?\n') 
What...is your name? 

Authur, King of the Britons! 

>>> name 


Authur, King of the Britons! 








提示 信息 最 后 的 \n 表示 一 个 换行 符 ， 它 是 会 引起 输出 显示 换行 的 
特殊 字符 。 这 也 是 为 何 用 户 的 输入 显示 在 提示 信息 的 下 一 行 的 原因 。 








如 果 和 希望 用 户 输 入 一 个 整数 ， 可 以 尝试 将 输入 值 转换 为 int : 


>>> prompt = 'What...is the airspeed velocity of an unladen swallow?\n' 
>>> speed = input(prompt) 
What...is the airspeed velocity of an unladen swallow? 


42 


>>> int(speed) 
42 





但 如 果 用 户 输 入 不 是 数字 的 话 ， 会 得 到 错误 : 


>>> speed = input(prompt) 
What...is the airspeed velocity of an unladen swallow? 
What do you mean, an African or a European swallow? 


>>> int(speed) 
ValueError: invalid literal for int() with base 10 





后 面 我 们 会 看 到 如 何 处 理 这 种 错误 。 


5.12 ”调试 





S RAIS RMS TIN iI, Hea SRN, 12 
有 时 候 反 而 会 信 息 过 量 o 最 有 用 的 信 Ae 。 








错误 的 类 型 ; 
。 发 生 错误 的 地 方 。 


语法 错误 通常 都 很 容易 定位 ， 但 也 有 严 手 之 处 。 空 格 问 题 引起 的 错 
误 很 难处 理 ， 因 为 空格 和 制 表 符 都 是 不 可 见 的 ， 我 们 已 经 习惯 于 忽视 它 
们 。 





File "<stdin>", line 1 
y = 6 


八 


IndentationError: unexpected indent 





INAFE, Tale ERA ERITEENETE. (EE E 
指 癌 的 是 y ， 容 易 误导 。 忆 的 来 说 ， 出 错 消 轧 会 告诉 我 们 及 现 错误 的 地 
址 ， 但 真正 发 生 的 地 方 可 能 在 更 前 面 的 代码 中 ， 有 时 候 甚至 在 前 一 行 。 








运行 时 错误 也 是 如 此 。 假 设 你 想 要 按照 分 贝 来 计算 信 噪 比 。 公 式 
是 SNR qb = 10 lg(P signal /P noise )。 在 Python 中 ， 你 可 能 会 这 么 写 : 





import math 

Signal_power = 9 

noise power = 10 

ratio = signal_power // noise power 


decibels = 10 * math.1log1@(ratio) 
print(decibels) 





在 运行 这 个 程序 时 ， 会 得 到 一 个 异常 


Traceback (most recent call last): 
File "snr.py", line 5, in ? 
decibels = 10 * math.1log10(ratio) 


ValueError: math domain error 





出 错 消息 指 同 第 5 行 ， 但 那 一 行 其 实 没有 什么 错误 。 要 找到 真正 的 
错误 ， 可 能 需要 打印 出 ratio 的 值 ， 结 果 你 会 发 现 是 90。 问题 出 在 第 4 
行 ， 这 里 使 用 了 向 下 取 整 除法 而 不 是 浮 点 数 除法 。 





你 应 该 伦 一 些 时 间 认 真 阅读 出 错 消 息 ， 但 不 要 认为 出 错 消 妃 上 说 的 
每 一 样 都 对 。 


5B Aar 


问 下 取 整 除法 (floor division) : 用 // 表示 的 操作 符 ， 用 于 将 两 个 
数 相 除 ， 并 对 结果 进行 癌 下 取 整 〈 靠 近 0 取 整 ) ， 得 到 整数 结果 。 





求 模 操作 符 (modulus operator) : H% 表示 的 操作 符 ， 用 于 两 个 整 
数 ， 返 回 两 数 相 除 的 余数 。 


布尔 表达 式 (boolean expression) : 一 种 表达 式 ， 其 值 是 True 
或 False 。 


关系 操作 符 (relational operator) : 用 来 表示 两 个 操作 对 象 的 比较 
关系 的 操作 符 ， 如 下 之 一 : ==, l=, >, <, >= 和 <=。 


逻辑 操作 符 Clogical operator) : 用 来 组 合 两 个 布尔 表达 式 的 操作 
符 ， 有 3 个 : and. or 和 not 。 


条 件 语句 (conditional statement) : 依照 某 些 条 件 控 制程 序 执行 流 
程 的 语句 。 





SAF Ccondition) : 条 件 语 句 中 的 布尔 表达 式 ， 由 它 决 定 执 行 哪 一 


个 分 文 。 


合 语句 (compound statement) : 一 个 包 合 语句 头 和 语句 体 的 语 
句 。 语 句 头 以 冒号 C) 结尾 。 语 名 体 相 对 语句 头 缩 进 一 层 。 








TX (branch) : 条 件 语句 中 的 一 个 可 能 性 分 文 语 句 段 。 


条 件 链 语句 (chained conditional) : 一 种 包含 多 个 分 支 的 条 件 语 
Ajo 


REZIA (nested conditional) : 在 其 他 条 件 语 句 的 分 支 中 出 
现 的 条 件 语句 。 


返回 语句 (return statement) : 导致 一 个 函数 立即 结束 并 返回 到 调 
用 者 的 语句 。 


递归 (recursion) : 在 当前 函数 中 调用 自己 的 过 程 。 


基准 情形 (base case) : 递归 函数 中 的 一 个 条 件 分 文 ， 里 面 不 会 再 
继续 递归 调用 o 


无 限 递归 (infinite recursion) : 没有 基准 情形 的 递归 ， 或 者 永远 无 
法 达到 基准 情形 的 分 支 的 递归 调用 。 最 终 ， 这 种 无 限 递归 会 导致 运行 时 
错误 。 


5.14 练习 


练习 5-1 


time 模块 提供 了 一 个 函数 ， 名 字 也 叫 time ， 它 能 返回 从 “纪元 ”起 
到 当前 的 格林 尼 治 时 间 。*“ 纪 元 ”其实 是 人 为 选 作 基准 点 的 时 间 。 在 
UNIX 系 统 中 ， 纪 元 时 间 点 是 1970 年 1 月 1 日 。 








>>> import time 
>>> time.time() 


1437746094 .5735958 





编写 一 个 脚本 ， 读 取 当 前 时 间 ， 并 转换 为 一 天 中 的 小 时 数 、 分 钟 
数 、 秒 数 ， 以 及 从 纪元 起 到 现在 的 天 数 。 


练习 5-2 





费 马 大 定理 是 说 对 于 任何 大 于 2 的 mn ， 不 存在 任何 正 整数 g 、b Alle 
能 够 满足 : 


a" + bt = 


1. 编写 一 个 函数 check_fermat ， 接 收 4 个 形 参 〈 即 a b, c 和 mn 
) 并 检查 费 马 定理 是 否 成 立 。 如 果 m 比 2 大 并 且 满 足 





a" + b” =" 


MEF MSFT ENA, RSL! ”， 人 否则 程序 应 当 打 印 “ 不 ， 





那样 不 行 ”。 


2. 编写 一 个 函数 ， 提 示 用 户 输入 a 、b 、c 和 n 的 值 ， 将 它们 转换 
为 整数 ， 并 使 用 check_fermat 来 检查 它们 是 否 违背 了 费 马 定理 。 








练习 5-3 








如 果 给 你 3 根木 棍 ， 你 可 能 可 以 将 它们 摆 成 一 个 三 角形 ， 也 可 能 不 
可 以 。 例 如 ， 如 果 一 根木 棍 的 长 度 是 12 英 寸 ， 而 其 他 两 根 都 只 有 1 英 
寸 ， 那 么 你 无 法 让 短 的 木 棍 在 中 间 相 接 。 对 于 任意 3 个 长 度 ， 有 一 个 简 
单 的 测试 可 以 检验 它们 是 否 可 能 组 成 一 个 三 角形 : 














如 果 其 中 有 任意 一 个 长 度 的 值 大 于 其 他 两 个 长 度 的 和 ， 则 你 不 能 组 
成 三 角形 。 人 否则 可 以 。《 如 宁 两 个 长 度 的 和 等 于 第 三 个 ， 则 它们 组 成 一 
个 “退化 ”的 三 角 。) 


1. 编写 一 个 函数 ijs_triangle ， 接 收 3 个 整数 参数 ， 并 根据 这 组 
长 度 的 木 棍 是 售 能 组 成 三 角形 来 打印 “Yes” 或 <No”。 


2. 编写 一 个 函数 提示 用 户 输入 3 根木 棍 的 长 度 ， 将 其 转换 为 整数 ， 
并 使 用 is_triangle 检查 这 些 长 度 的 木 棍 是 否 可 以 组 成 三 角形 。 


练习 5-4 


下 面 的 程序 的 输出 是 什么 ? 男 一 个 栈 图 来 显示 程序 打印 结果 的 时 候 
的 状态 。 


def recurse(n, s): 


if n == 0: 
print(s) 


else: 
recurse(n-1, n+s) 


recurse(3, @) 





1. 如 果 像 recurse(-1，6) 这 样 调 用 这 个 函数 ， 会 发 生 什么 ? 


2. 编写 一 段 文档 字符 串 ， 向 人 解释 清楚 要 使 用 这 个 函数 主要 知道 
的 东西 “并 且 不 多 写 其 他 内 容 ) 。 


3. 接 下 来 的 练习 需要 使 用 第 4 章 描 述 的 turtle 模块 。 





练习 5-5 








/ 


阅读 下 面 的 函数 ， 并 看 看 你 能 否 弄 清楚 它 在 做 什么 “参看 第 4 章 中 
的 示例 ) 。 接 着 运行 它 ， 看 你 的 理解 是 否 正确 。 


def draw(t, APNE ER, n): 
if n == 
return 
angle = 50 
t.fd(length*n) 
t.1t(angle) 


draw(t, length, n-1) 
t.rt(2*angle) 
draw(t, length, n-1) 
t.1t(angle) 
t.bk(length*n) 





练习 5-6 


科 赫 曲线 (Koch curve) 是 一 个 分 形 ， 它 看 起 来 像 图 5-2 所 示 。 要 
绘制 一 个 长 度 为 x 的 科 赤 曲线， 你 只 需要 做 : 


1. 绘制 长 度 为 x /3 的 科 赫 曲线 。 
2. 向 左 转 60。。 
3. 绘制 长 度 为 x/3 的 科 赫 曲线 。 
4. 同 石 转 120°。 
5. 绘制 长 度 为 x /3 的 科 赫 曲线 。 
6. 向 左 转 60。。 


7. 绘制 长 度 为 x /3 的 科 赫 曲线 。 





图 5-2 一 个 科 赫 曲线 


当 x 比 3 小 的 时 候 例 外 : 在 那 种 情况 下 ， 你 可 以 直接 绘制 一 个 长 度 
为 x 的 直线 。 


1. 编写 一 个 函数 Koch ， 接 收 一 个 Turtle 以 及 一 个 长 度 作 为 形 参 ， 
并 使 用 Turtle 绘 制 指 定 长 度 的 科 赫 曲线 。 


2. 编写 一 个 函数 snowflake ， 绘 制 3 条 科 赫 曲线 ， 组 成 一 个 雪花 形 


状 。 解 答 : http://thinkpython2.com/code/koch.py - 


3. 科 赫 曲线 可 以 用 几 种 方法 泛 化。 参看 
http://en.wikipedia.org/wiki/Koch_snowflake 中 的 例子 ， 并 实现 你 最 喜欢 
HS 





PoR 有 返回 值 的 函数 


我 们 用 过 的 很 多 Python 函数 《如 数学 函数 ) 都 会 产生 返回 值 。 但 
征 ， 到 目前 为 止 我 们 写 的 函数 都 是 没有 返回 值 的 : 它们 只 产生 一 个 效 
果 ， 如 打印 东 坚 值 或 者 移动 马公， 但 是 并 不 返回 值 。 在 本 章 中 你 将 学 会 
如 何 写 有 返回 值 的 函数 。 








6.1 返回 值 


调用 函数 会 产生 一 个 返回 值 ， 我 们 一 般 会 将 它 赋值 给 一 个 变量 或 者 
用 作 表 达 式 的 组 成 部 分 


e = math.exp(1.@) 
height = radius * math.sin(radians) 








目前 为 止 我 们 写 的 函数 都 是 无 返回 值 的 函数 。 用 通俗 的 话说 ， 它 们 
没有 返回 值 ， 用 更 精确 的 话说 ， 它 们 返回 的 值 是 None 。 


KEP, RIS AT) 写 一 些 有 返回 值 函数 。 第 一 个 例子 是 area 
， 用 于 计算 给 定 半径 的 圆 的 面积 








def area(radius): 
a = math.pi * radius**2 


return a 





之 前 我 们 已 经 见 过 return 语句 ， 但 在 有 返回 值 函 数 中 ，return 语 
名 包含 了 一 个 表达 式 。 这 个 语句 的 意思 是 : “立即 从 这 个 函数 中 返回 ， 
jackie saris 回 值 。” 表 达 式 可 以 任意 复杂 ， 所 以 我 们 可 
以 把 这 个 函数 写 得 更 紧凑 : 


def area(radius): 
return math.pi * radius**2 





Fy FTA, RAAF 这 样 的 临时 变量 Fa Se LE Vd A BE ZED o 


有 时 候 函 数 中 针对 不 同 的 条 件 分 支 ， 各 有 各 的 返回 语句 会 很 有 用 
处 : 
def absolute _ value(X) : 


if x < 0: 
return -x 


else: 
return x 





因为 return 语句 分 别 在 不 同 的 分 支 中 ， 只 有 一 个 运行 。 


一 旦 return 语句 运行 ， 当 前 的 函数 就 会 终结 ， 后 面 的 语句 不 会 执 
行 。return 语句 之 后 的 代码 ， 或 者 在 其 他 程序 流程 永远 不 可 能 达到 的 
地 方 的 代码 ， 称 为 无 效 代码 (dead code) 。 


在 有 返回 函数 中 ， 保 证 每 个 可 能 执行 路 径 上 都 会 遇 到 return 语 
人 句 ， 是 个 很 好 的 主意 。 例 如 : 
def absolute value(x): 


if x < 0: 
return -x 


if x > 0: 
return x 








这 个 函数 并 不 正确 ， 因 为 如 果 x 正好 是 0， 则 两 个 条 件 都 不 为 true， 
则 此 时 函数 会 没有 遇 到 return 语句 就 终结 了 。 如 果 执 行 流程 到 了 函数 
的 结尾 ， 返 回 值 是 None ， 它 并 不 是 0 的 绝对 值 。 





>>> absolute_value(@) 
None 





顺便 说 一 下 ，Python 内 置 提 供 了 计算 绝对 值 的 函数 abs 。 


作为 练习 ， 写 一 个 compare 函数 ， 带 两 个 参数 x 和 y ， 如 果 x > y 
’ 返回 1， 如 果 x == y ， 返回 0， 如 果 x < y > 返回 -1。 


6.2 HENK 


当 你 号 更 复杂 的 函数 时 ， 可 能 会 发 现 需要 更 多 的 时 间 来 调试 。 为 了 
对 应 不 断 增加 的 程序 复杂 度 ， 你 可 能 会 想 答 试 一 下 称 为 增 量 开发 的 过 
程 。 增 量 开发 的 目标 是 通过 每 次 只 增加 和 测试 一 小 部 分 代码 ， 来 避免 长 
时 间 的 调试 过 程 。 





例如 ， 假 设 你 想 要 查找 两 点 之 间 的 距离 ， 给 定 坐 标 (x 1 y ME, 
)。 根 据 毕 达 哥 拉 斯 定理 ， 距 离 是 : 





距离 = V (72 -ry + (Y2 一 yi) 


一 步 考 虑 Python 中 distance 函数 应 该 是 什么 样子 的 。 换 名 话 
ti, A GBB) 是 什么 ?输出 (返回 值 ) 是 什么 ? 


在 这 个 例子 中 ， 输 入 是 两 个 点 ， 并 可 以 用 4 个 数字 来 表示 。 返 回 值 
是 距离 ， 它 用 一 个 浮 点 数 表 示 。 


现在 就 可 以 写 出 函数 的 轮廓 了 : 


def distance(x1, y1, x2, y2): 
return 0.0 











显然 ， 现 在 这 个 版 本 计算 的 并 不 是 距离 ; 它 总 是 返回 0。 但 它 是 语 
法 结构 正确 的 ， 并 且 能 运行 ， 即 意味 着 你 可 以 在 继续 开发 更 复杂 的 功能 
之 前 对 它 进 行 初步 的 测试 。 


要 测试 这 个 新 函数 ， 使 用 样本 参数 调用 它 : 


>>> distance(1, 2, 4, 6) 
0.0 





我 选择 这 些 值 ， 因 为 这 样 两 个 点 之 间 ， 横 同 距 离 是 3， 纵 同 距 离 是 
4; 也 就 是 ， 结 果 是 5 (3-4-5 直 角 三 角形 的 斜 边 ) 。 当 测试 一 个 函数 时 ， 
事先 知道 正确 的 结果 是 很 有 用 的 。 


到 这 个 时 候 我 们 已 经 确认 隙 ai 吾 法 形式 是 正确 的 ， 紧 接着 可 以 给 
函数 体 添加 代码 了 。 合 理 的 下 一 个 步 又 是 找到 距离 差 x 9 — x1 Myy] À 
下 一 版 本 的 函数 将 这 两 个 距 SE RAEI 时 变量 中 并 打印 出 来 。 





def distance(x1, y1, x2, y2): 
dx = x2 - x1 
dy = y2 - y1 
print('dx is', dx) 
print('dy is', dy) 
return 0.0 








如 果 函 数 正 确 执行 ， 应 该 会 显示 “dx is 3° 和 ‘dy is 4? . WE 
确实 如 此 ， 我 们 就 可 以 确认 函数 正确 地 获得 了 实 参 ， 并 正确 地 执行 了 第 
一 步 计 算 。 如 果 不 是 如 此 ， 则 只 有 几 行 代码 需要 检查 。 








下 一 步 我 们 计算 dx 和 dy 的 平方 和 : 





def distance(x1, y1, x2, y2): 
dx = x2 - x1 


dy = y2 - yl 
dsquared = dx**2 + dy**2 
print('dsquared is: ', dsquared) 


return 0.0 


同样 地 ， 你 可 以 在 这 里 再 运行 一 过 程序 ， 并 检查 输出 〈 应 该 是 
25) 。 最 后 ， 可 以 使 用 math.sqrt 来 计算 并 返回 结果 : 


def distance(x1, y1, x2, y2): 
dx = x2 - x1 
dy = y2 - y1 
dsquared = dx**2 + dy**2 


result = math.sqrt(dsquared) 
return result 





如 果 这 个 函数 运行 正确 ， 那 么 你 的 任务 就 完成 了 。 否 则 ， 你 可 能 
要 在 return 语句 之 前 打印 出 result 的 值 。 


最 终 版 本 的 函数 运行 时 并 不 打印 任何 东西 ， 它 只 会 返回 一 个 值 。 我 
们 之 前 写 的 print 语句 在 调试 时 很 有 用 ,但 一 旦 你 的 函数 编写 正确 ， 残 
应 该 删除 挥 它们 。 这 种 代码 称 为 脚手架 代码 (scaffolding〉， 因 为 它们 
在 构建 程序 的 过 程 中 很 有 用 ， 但 并 不 是 最 终 产 品 的 一 部 分 。 








开始 的 时 候 ， 应 当 每 次 只 添加 一 到 两 行 代码 。 当 你 获得 更 多 经 验 之 
后 ， 就 会 发现 目 己 可 以 编写 和 调试 更 多 的 代码 了 。 不 论 如 何 ， 增 量 开 友 
都 能 帮 你 节省 大 量 的 调试 时 间 。 





个 过 程 有 以 下 几 个 关键 后 。 





1. 以 一 个 可 以 正确 运行 的 程序 开始 ， 每 次 只 做 小 的 增 量 修 改 。 如 
果 在 任意 时 刻 发 现 错误 ， 你 都 应 当知 道 错 在 哪里 。 








2. 使 用 临时 变量 保存 计算 的 中 间 结 果 ， 你 可 以 显示 和 检查 它们 。 





3. 一 旦 整个 程序 完成 ， 你 可 能 会 想 要 删除 掉 某 些 脚 手 架 代码 或 者 
把 多 个 语句 综合 到 一 个 复杂 表达 式 中 。 但 只 在 不 会 增加 代码 阅读 的 难 拔 
时 才 应 该 那么 做 。 





作为 练习 ， 使 用 增 量 开 发 来 编写 一 个 函数 hypotenuse ， 给 定 直 角 
三 角形 的 另外 两 个 直角 边 的 长 度 时 ， 它 返回 斜 边 的 长 度 。 开 发 过 程 中 ， 
记录 每 一 步 的 情况 。 


63 组 合 


你 可 能 已 经 想到 ， 在 一 个 函数 中 可 以 调用 男 外 一 个 函数 。 作 为 示 
例 ， 我 们 会 写 一 个 函数 ， 它 接收 两 个 扣 ， 圆 心 和 圆周 上 的 一 点 ， 并 计算 
圆 的 面积 





假设 圆心 保存 在 变量 xc 和 yc 中 ， 而 圆周 上 的 点 保存 在 xp 和 yp 
eee 也 就 是 这 两 个 点 的 距离 。 我 们 刚才 已 经 写 
了 一 个 函数 ，distance ， 正 好 有 这 个 功能 


radius = distance(xc, yc, xp, yp) 


第 二 步 是 使 用 上 一 步 算出 来 的 半径 来 计算 圆 的 面积 。 我 们 刚才 也 写 
了 这 个 函数 : 


result = area(radius) 


将 这 两 步 封装 成 一 个 函数 ， 我 们 得 到 : 





def circle_area(xc, yc, xp, yp): 
radius = distance(xc, yc, xp, yp) 
result = area(radius) 


return result 











临时 变量 radius 和 result 在 开发 和 调试 时 有 用 ， 可 一 旦 程序 已 经 
可 以 正确 运行 ， 我 们 就 可 以 使 用 函数 组 合 来 简化 函数 : 





def circle_area(xc, yc, xp, yp): 
return area(distance(xc, yc, xp, yp)) 





6.4 布尔 函数 


函数 可 以 返回 布尔 值 ， 这 样 可 以 很 方便 地 隐藏 函数 内 复杂 的 检测 。 
例如 : 


def is divisible(x, y): 
if x % y == 0: 


return True 


else: 
return False 








通常 布尔 函数 的 命名 都 类 似 于 是 / 否 的 问 句 。is divisible 返回 
True 或 False ， 表 示 x 是 否 可 以 被 y 整除 。 





这 里 是 一 个 例子 : 


>>> is_divisible(6, 4) 
False 
>>> is_divisible(6, 3) 
True 





== 操作 符 的 结果 是 一 个 布尔 值 ， 所 以 我 们 可 以 把 这 个 函数 写 得 更 
MAB: 


def is _divisible(x, y): 
return x % y == 6 





布尔 函数 第 第 用 在 条 件 语 句 中 : 


if is divisible(x, y): 
print('x is divisible by y') 


if is divisible(x, y) == True: 
print('x is divisible by y') 





但 这 里 多 出 来 的 比较 是 不 必要 的 。 


作为 练习 ， 写 一 个 函数 is_between(X，y，z) ， 当 x<y<z 时 ， 返 
回 True ， 其 他 情况 返回 False 。 


6.5 HKHH 


至 今 为 止 ， 我 们 只 涉及 Python 的 一 个 很 小 的 子 集 ， 但 你 可 能 会 有 兴 
趣 知道 ， 这 个 子 集 已 经 是 一 个 完备 的 编程 语言 ， 也 就 是 说 ， 任 何 可 以 
计算 的 问题 ， 痢 可 以 用 这 个 子 集 语言 来 完成 。 任 何 已 有 的 程序 ， 痢 可 以 
用 现在 已 经 学 会 的 语言 特性 重 写 出 来 (实际 上 ， 可 能 还 需要 一 些 命 令 来 
控制 诸如 键盘 、 鼠 标 、 光 盘 之 类 的 设备 ， 但 仅 此 而 已 ) 。 


要 证 明 这 个 论断 ， 并 不 是 简单 的 工作 。 这 个 证 明 最 早 是 由 第 一 代 计 
算 机 科学 家 之 一 阿兰 :图 灵 (Alan Turing) 完成 的 《有 人 会 争辩 他 其 实 
征 个 数学 家 ， 但 大 部 分 早期 的 计算 机 科学 家 者 是 从 数学 家 开始 的 ) 。 因 
此 ， 这 被 称 为 图 灵 论 题 (Turing Thesis) 。 若 想 了 解 关 于 图 灵 论 题 的 更 
完整 〈 更 准确 ) 的 讨论 ， 我 推荐 Michael Sipser 的 《计算 理论 导 引 》 
(Introduction to the Theory of Computation , Course Technology, 2012) 
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为 了 初步 了 解 如 何 使 用 我 们 现在 学 会 的 工具 ， 可 以 考虑 几 个 递归 定 
义 的 数学 图 数 。 递 归 定 义 和 循 环 定 义 有 些 相 似 ， 因 为 同样 地 ， 定 义 中 都 
会 包含 要 定义 的 事物 本 身 。 真 正 的 循环 定义 往往 没什么 用 : 


vorpal: 
一 个 形容 词 ， 用 来 描述 一 个 vorpal 的 事物 。 


GOR US TE vel BEG BREE MC ERREAZ. FT, W 
末 你 碍 看 阶乘 函数 《用 ! 表 示 ) 的 定义 ， 可 能 会 看 到 如 下 内 容 : 


0!=1 


n!=n(n-1)! 


这 个 定义 说 明 0 的 阶乘 是 1， 而 任意 其 他 值 的 阶乘 是 n -1ER 
Lin o 


所 以 3! 是 3 乘 以 2!， 而 2! 是 2 乘 以 1!， 而 1! 是 1 乘 以 0!。 综 合 起 来 ，3! 
等 于 3 乘 以 2 乘 以 1 乘 以 1， 即 6。 








如 果 能 够 使 用 递归 定义 来 描述 一 个 事物 ， 那 么 也 可 以 使 用 Python 程 
序 来 计算 它 。 第 一 步 是 决定 使 用 什么 形 参 。 在 这 个 例子 里 ， 很 明显 函 


数 factorial 需要 一 个 整数 形 参 : 


def factorial(n): 


如 果实 参 正 好 是 0， 我 们 只 需要 直接 返回 1: 





def factorial(n): 
if n == @: 


return 1 








否则 ， 接 下 来 是 有 意思 的 地 方 ， 我 们 需要 递归 调用 函数 来 计算 n -1 
的 阶乘 ， 并 乘 以 mn : 





def factorial(n): 
if n == @: 
return 1 
else: 
recurse = factorial(n-1) 
result = n * recurse 


return result 


这 个 程序 的 运行 流程 和 5.8 节 里 的 countdown 函数 类 似 。 如 果 我 们 
使 用 实 参 值 3 调用 factorial : 





因为 3 不 是 0， 我 们 使 用 第 二 个 分 文 ， 计 算 n-1 的 阶乘 .……. 
因为 2 不 是 0， 我 们 使 用 第 二 个 分 支 ， 计 算 n-1 的 阶乘 .……. 


因为 1 不 是 0， 我 们 使 用 第 二 个 分 支 ， 计 算 n-1 的 阶乘 .……… 





因为 0 等 于 0， 我 们 使 用 第 一 个 分 文 并 返回 1， 不 再 需要 进 
行 任何 递归 调用 了 。 


返回 值 G) 乘 以 n=1 ， 结 有 果 返 回 。 
返回 值 G) 乘 以 n=2 ， 结 果 人 返回 。 


返回 值 (2) 乘 以 n=3 ， 结 果 是 6， 而 这 个 结果 就 是 整个 函数 的 返回 
值 。 





图 6-1 显 示 了 这 一 系列 函数 调用 的 栈 图 。 


man 
6 

factorial n —> 3 recurse —> 2 result —> 6 
2 

factorial n —> 2 recurse —~> 1 result —= 2 
1 

factorial n —> 1 recurse 一 = 1 result 一 = 1 
1 


factorial n 一 = 0 
图 6-1 EI 


结果 值 在 图 中 显示 为 沿 着 栈 向 上 回 传 。 在 每 个 帧 中 ， 返 回 值 
是 result 的 值 ， 即 n 和 recurse 的 乘积 。 


最 后 一 帧 中 ， 局 部 变量 recurse 和 result 不 存在 ， 因 为 新 建 它们 
的 分 支 并 没有 运行 。 


6.6 ”坚持 信念 


跟踪 程序 执行 的 流程 是 阅读 程序 的 一 个 办 法 ， 但 那样 很 快 就 会 陷入 
迷宫 境况 。 力 外 有 个 办 法 ， 我 称 为 “坚持 信念 ”"。 在 过 到 一 个 函数 调用 
时 ， 不 去 跟踪 执行 的 流程 ， 而 假定 函数 是 正确 工作 的 ， 能 够 返回 正确 
的 结果 。 








事实 上 ， 在 使 用 内 置 函 数 时 ， 你 已 经 在 这 样 尝试 着 坚持 信念 了 。 当 
调用 math .cos 或 math .exp 时 ， 你 并 不 去 检查 那些 函数 的 内 部 实现 。 
你 只 会 假定 它们 是 正确 的 ， 因 为 写 这 些 内置 函 数 的 一 定 是 很 优秀 的 程序 


=] 
A 
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当 调 用 自己 写 的 函数 时 ， 这 个 道理 也 成 立 。 例 如 ， 在 6.4 节 中 ， 我 
们 写 了 is_divisible 函数 用 来 判断 一 个 数 是 否 可 以 被 妨 一 个 数 整除 。 
一 旦 我 们 说 服 上 自己 认定 这 个 函数 是 正确 的 一 一 通过 检查 代码 和 测试 
就 可 以 直接 使 用 它 ， 而 不 需要 再 细 看 内 部 实现 了 。 





对 递归 函数 来 说 ， 也 是 如 此 。 当 调用 递归 函数 时 ， 不 需要 检查 执行 
的 流程 ， 你 应 该 假定 递归 调用 是 正确 的 〈 返 回 正确 的 结果 ) ， 并 问 自 
己 : “假设 我 能 够 正确 得 到 n -1 的 阶乘 ， 如 何 计算 n 的 阶乘 ? ”很 明显 你 
可 以 做 到 ， 直 接 乘 以 n 即 可 。 


当然 ， 在 还 没有 完成 函数 的 编写 时 ， 就 假设 它 能 正确 工作 ， 看 起 来 
有 些 奇 怪 ， 但 那 也 正 是 为 什么 我 称 它 为 "坚持 信念 ”的 原因 ! 


6.7 “ 另 一 个 示例 





除 阶乘 factorial 之 外 ， 最 常见 的 递归 数学 定义 是 韭 波 那 执 数列 
(fibonacci ) ， 其 定义 如 下 (参见 


http://en.wikipedia.org/wiki/Fibonacci_number) : 
fibonacci(0)= 0 
fibonacci (1)= 1 
fibonacci (n ) = fibonacci (n - 1) + fibonacci (n - 2) 


翻译 成 Python 后 ， 看 起 来 是 这 样 : 





def fibonacci (n): 
if n == 
return @ 
elif n == 


return 1 
else: 
return fibonacci(n-1) + fibonacci(n-2) 





如 果 你 在 这 里 试图 跟踪 执行 的 流程 ， 即 使 是 很 小 的 参数 mn ， 都 会 感 
觉 头 都 要 炸 了 。 但 因为 坚持 信念 ， 如 果 你 假定 两 个 递归 调用 都 正名 工 
作 ， 那 么 很 明显 ， 把 它们 加 到 一 起 必然 得 到 正确 的 结果 。 





6.8 ”检查 类 型 





如 果 我 们 调用 factorial 函数 ， 并 给 定 1.5 作 为 实 参 ， 会 发 生 什 么 
呢 ? 


>>> factorial(1.5) 
RuntimeError: Maximum recursion depth exceeded 








看 起 来 像 是 无 限 递归 。 怎 么 会 这 样 ? 函数 中 有 一 个 基准 情形 
“in == 6 时 。 但 如 果 n 不 是 整数 ， 我 们 就 可 能 错过 这 个 基准 情形 ， 而 
永远 递归 下 去 。 








在 第 一 个 递归 调用 中 ，n 是 0.5。 第 二 个 ，n 是 -0.5。 从 此 以 后 ， 它 
会 越 来 越 小 〈 更 小 的 负数 ) ， 但 永远 不 会 变 成 0。 





我 们 有 两 个 选择 。 可 以 答 试 泛 化 函数 factorial ， 使 之 能 正确 处 理 
浮 点 数 ， 或 者 我 们 也 可 以 让 factorial 检查 其 实 参 的 类 型 。 第 一 个 选择 
在 数学 上 叫 作 伽 玛 函数 (gamma function) ， 它 有 些 超出 了 本 书 的 范 
围 。 所 以 我 们 选择 第 二 个 


我 们 可 以 使 用 内 置 函 数 isinstance 来 检查 实 参 的 类 型 。 与 此 同 


时 ， 我 们 也 可 以 确保 实 参 是 正 数 : 


-> 





def factorial (n): 
if not isinstance(n, int): 
print('Factorial is only defined for integers.') 
return None 
elif n < @: 
print('Factorial is not defined for negative integers. ') 


return None 
elif n == 0: 
return 1 
else: 
return n * factorial(n-1) 





Vay, 


第 一 个 基准 情形 处 理 非 整数 ， 第 二 个 处 理 负数 。 这 两 种 情况 中 ， 程 
序 打印 一 个 错误 信息 ， 并 返回 None ， 表 示 出 现 了 问题 : 





>>> factorial('fred') 

Factorial is only defined for integers. 
None 

>>> factorial(-2) 


Factorial is not defined for negative integers. 
None 





如 果 我 们 通过 了 这 两 个 测试 ， 就 能 确保 知道 mn 是正 数 或 0， 所 以 我 
们 可 以 证 明 递 归 必 然 终结 。 


这 个 程序 演示 了 一 个 模式 ， 它 有 时 被 称 为 守卫 (guardian) 。 前 两 
个 条 件 束 像 守卫 一 样 ， 保 护 后 面 的 代码 ， 以 免 出 现 错误 。 和 守卫 使 得 证 明 
代码 的 正确 性 成 为 可 能 。 


在 11.3 节 中 我 们 会 看 到 一 个 更 灵活 的 方案 ， 用 以 打印 错误 信息 : 抛 
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6.9 ”调试 


将 一 个 大 程序 分 解 为 小 函数 ， 目 然而 然 地 引入 了 调试 的 检查 点 。 如 
果 一 个 函数 不 能 正常 工作 ， 可 以 考虑 3 种 可 能 性 。 





函数 获得 的 实 参 有 问题 ， 东 个 前 置 条 件 没 有 达到 。 
男 数 本 身 有 问题 ， 茶 个 后 置 条 件 没 有 达到 。 
函数 的 返回 值 有 问题 ， 或 者 使 用 的 方式 不 正确 。 





要 排除 第 一 种 可 能 ， 可 以 在 函数 开始 的 地 方 加 上 print 语句 ， 显 示 
实 参 的 值 〈 以 及 它们 的 类 型 ) 。 或 者 可 以 添加 代码 来 显 式 地 检查 前 置 条 
人 


如 果实 参看 起 来 没 错 ， 在 每 个 return 语句 前 添加 print 语句 ， 显 
示 返 回 值 。 如 果 有 可 能 ， 手 动 检查 返回 值 。 考 虑 使 用 能 更 容易 检验 结 
的 实 参 来 调用 函数 ， 就 像 6.2 节 中 的 那样 。 





如 果 函 数 看 起 来 正常 ， 检 查 调用 它 的 代码 ， 确 保 返 回 值 税 正确 使 用 
(或 者 确实 被 使 用 了 ! ) 。 


在 函数 的 开端 和 结尾 处 增加 print 语句 ， 能 帮助 我 们 更 清晰 地 了 解 
函数 的 执行 流程 。 例 如 ， 这 里 是 一 个 添加 了 print 语句 的 factorial K 
AL: 





def factorial(n): 
Space = ' ' * (4 * n) 
print(space, ‘factorial’, n) 
if n == @: 
print(space, ‘returning 1') 


return 1 
else: 


recurse = factorial(n-1) 

result = n * recurse 

print(space, ‘returning’, result) 
return result 





space 是 一 个 字符 串 ， 包 含 多 个 空格 ， 用 来 控制 输出 内 容 的 缩 进 。 
下 面 是 调用 factorial(4) 的 结果 : 


factorial 4 
factorial 3 
factorial 2 
factorial 1 
factorial 6 
returning 1 


returning 1 
returning 2 
returning 6 
returning 24 





如 果 你 对 函数 调用 的 流程 有 困惑 ， 这 种 输出 可 以 帮 你 。 开 发 有 效 的 
脚手架 代码 需要 花费 时 间 ， 但 一 点 点 脚手架 可 以 节省 大 量 的 调试 。 





6.10 NEK 


临时 变量 (temporary variable) : 在 复杂 计算 中 用 于 保存 中 间 计 算 
值 的 变量 。 





无 效 代 码 (dead code) : 程序 中 的 一 些 代 码 ， 永 远 不 可 能 运行 。 
常常 是 写 在 return 语句 之 后 的 代码 。 


增 量 开 发 (incremental development) : 一 个 程序 开发 计划 ， 通 过 
每 次 只 增加 少量 代码 ， 并 加 以 测试 的 步骤 ， 来 减少 调试 。 


脚手架 代码 (scaffolding) : 在 开发 过 程 中 使 用 的 ， 但 在 最 终 版 本 
中 不 需要 的 代码 。 


守卫 (guardian) : 一 个 编程 模式 。 使 用 条 件 语句 来 检查 并 处 理 可 
能 产生 错误 的 情形 。 


6.11 练习 


2 >] 6-1 


为 下 面 的 程序 绘制 一 个 栈 图 。 程 序 的 输出 是 什么 ? 
b(z): 

prod = a(z, zZ) 

print(z, prod) 

return prod 
a(x, y): 


x=xXx+1 
return x * y 


C(x, Y, Z): 
total =x+y+z 


square = b(total)**2 
return square 


y=x+1 


print c(x, y+3, x+y) 





练习 6-2 


Ackermann 函 数 ，A (m,n), Æ CaF 


n+l if m=0 
A(m,.n) =< A(m—1,1) if m>Oandn=0 
A(m—1, A(m,n—1)) if m>Oandn>0O 


$4 http://en.wikipedia.org/wiki/Ackermann_function. 33 —^ RK 


数 ack ， 计 算 Ackermann 函 数 的 值 。 使 用 你 的 函数 求 ack(3，4) 的 值 ， 
它 应 当 是 125。 对 于 很 大 的 数字 m 和 n ， 会 发 生 什 么 ? 


解答 : http://thinkpython2.com/code/ackermann.py。 
练习 6-3 


回 文 是 一 个 正 同 和 逆 回 拼写 都 相同 的 单词 ， 例 
如 “noon2> 和 “redivider”。 递 归 地 说 ， 如 果 一 个 单词 第 一 个 和 最 后 一 个 字 
母 相 同 ， 并 且 中 间 是 一 个 回 文 ， 则 该 单词 是 回 文 。 





下 面 的 函数 接收 一 个 字符 串 形 参 并 返回 第 一 个 、 最 后 一 个 以 及 中 间 
的 字母 
def first(word): 

return word[@] 


def last(word): 
return word[ -1] 


def middle(word): 
return word[1:-1] 








在 第 8 章 中 得 看 它们 是 如 何 使 用 的 。 


1. 将 这 些 函 数 保 存 到 一 个 文件 palindrome .py 中 并 测试 它们 。 如 
果 你 使 用 一 个 包含 两 个 字母 的 字符 串 调 用 middle ， 会 发 生 什 么 ? 使 用 
一 个 字母 呢 ? 空 字 符 串 呢 ? 空 字符 串 写 作 ' ' 并 且 不 包含 任意 字母 。 


2. 编写 一 个 函数 is_palindrome ， 接 收 一 个 字符 串 形 参 ， 并 当 它 





是 回 文 的 时 候 返 回 True ， 奉 则 返回 False 。 记 着 你 可 以 使 用 内 置 函 
数 len 来 检测 字符 串 的 长 度 。 


解答 : http://thinkpython2.com/code/palindrome_soln.py。 
练习 6-4 


我 们 说 一 个 数 a 是 b FETT, Wa 可 以 被 b HBR, Ff Ha /b 也 是 b 
的 滋 方 。 编 写 一 个 函数 is_power 接收 形 参 a 和 b ， 当 a 是 b MIAN IK 
回 True 。 注 意 : 你 需要 考虑 基准 情形 。 


练习 6-5 


a 和 的 最 大 公约 数 〈GCD) 是 它们 两 个 都 能 整除 的 最 大 的 数 。 





寻找 两 个 数 的 最 大 公约 数 的 方法 之 一 是 基于 如 下 观察 : 如果 r 是 a 
除 以 b 的 余数 ， 则 gcd(a ,b ) = gcd(b ,r )。 作 为 基准 情形 ， 我 们 可 以 使 用 
gcd(a, 0)=a o 


编写 一 个 函数 gcd ， 接 收 形 参 a 和 b ， 并 返回 它们 的 最 大 公约 数 。 


鸣谢 :这 个 练习 是 基于 Abelson 和 Sussman 的 《计算 机 程序 的 构造 和 
解释 》 Structure and Interpretation of Computer Programs ) (MIT 出 版 
#t, 1996) 一 书 。 


Sac 


本 章 讲 关于 迭代 的 话题 。 迭 代 即 重复 运行 一 段 代 码 语句 块 的 能 
我 们 在 5.8 市 见 过 一 种 使 用 递归 来 进行 的 兴 代 ， 在 4.2 市 中 见 过 为 一 种 使 
用 for 循环 进行 的 迭代 。 在 本 半 中 我 们 将 会 看 到 使 用 while 循环 进行 的 
第 三 种 达 代 。 首 先 我 们 先进 一 步 讲 讲 变 量 赋值 的 话题 。 


7.1 重新 赋值 


你 应 当 已 经 发 现 ， 对 一 个 变量 进行 多 次 赋值 是 合法 的 。 新 的 赋值 语 





句 使 现 有 的 变量 引用 一 个 新 值 “ 并 不 再 引用 老 值 ) 。 





因为 第 一 次 显示 x 时 ， 它 的 值 是 5， 而 第 二 次 时 它 的 值 是 7。 








图 7-1 显 示 了 在 状态 图 中 ， 重 新 赋值 是 什么 样子 的 。 





图 7-1 ”状态 图 





在 这 里 我 想 解释 一 个 常见 的 误区 。 因 为 Python 使 用 等 号 〈= ) RR 
示 赋 值 ， 故 很 容易 将 a = b 这 样 的 赋值 语句 错误 理解 为 数学 中 表示 a 和 
b 相等 的 命题 。 这 样 理解 是 错误 的 。 


首先 ， 相 等 判断 是 个 对 称 的 关系 ， 而 赋值 并 不 是 。 例 如 ， 在 数学 
中 ， 如 果 a =7 那 么 7=a 。 但 是 在 Python 中 ， 语 句 a = 7 是 合法 的 ， 但 7 = 


a 则 是 非法 的 。 


男 外 ， 在 数学 中 ， 一 个 相等 判断 的 命题 总 是 非 真 即 假 。 如 果 现 在 a 
=b ， 那 么 a 总 会 等 于 b 。 在 Python 中 ， 赋 值 语句 会 让 两 个 变量 变 得 相 
等 ， 但 它们 并 不 会 总 保持 那个 状态 : 





# a 和 b 现 在 相等 了 
# a 和 b 不 再 相等 了 





第 三 行 修改 a 的 值 ， 但 是 并 不 会 修改 b 的 值 ， 所 以 它们 不 再 相等 。 





虽然 重新 赋值 常常 很 有 用 处 ， 但 是 应 该 谨慎 使 用 。 如 宋 变 量 的 值 经 
常 变 化 ， 会 导致 程序 难以 阅读 和 调试 。 


7.2 更 新 变量 





重新 赋值 的 最 常见 形式 是 更 新 ， 此 时 变量 的 新 值 依赖 于 旧 值 。 


>>>x=x+1 


这 个 语句 的 意思 是 “获取 x 的 当前 值 ， 加 一 ， 再 更 新 x 为 此 新 值 ”。 








如 果 和 尝试 更 新 一 个 并 不 存在 的 变量 ， 则 会 得 到 错误 ， 因 为 Python 在 
赋值 给 x 之 前 会 先 计算 等 号 右边 的 部 分 : 





>>>x=x+1 
NameError: name 'x' is not defined 








在 更 新 变量 之 前 ， 必 须 先 对 它 进行 初始 化 。 通 常 通 过 一 个 简单 赋 
值 操作 来 进行 初始 化 : 


>>> X = 0 
>>>x=x+1 





通过 加 1 来 更 新 一 个 变量 ， 称 为 增 量 Cincrement) ; 减 1 的 操作 称 
为 减 量 (decrement) 。 


7.3 while 语句 


计算 机 常 被 用 来 自动 化 重复 处 理 某 些 任 务 。 重 复 执行 相同 或 相似 的 
任务 ， 而 不 犯错 误 ， 这 是 电脑 所 擅长 于 人 之 处 。 在 计算 机 程序 中 ， 重 复 
也 被 称 为 迭代 。 





我 们 之 前 已 经 看 到 两 个 函数 countdown 和 print_n ， 它 们 使 用 递 
归来 进行 迭代 操作 。 由 于 迭代 如 此 常见 ，Python 提 供 了 语言 特性 来 支持 
它 。 其 中 一 个 是 我 们 在 4.2 节 中 见 过 的 for 循环 语句 。 后 面 我 们 会 再 回 到 


这 个 话题 。 


另 一 个 则 是 while 语句 。 下 面 是 使 用 while 语句 实现 的 countdown 
函数 : 


def countdown(n): 

while n > @: 

print(n) 
n=n-1 


print('Blastoff!') 





你 基本 上 可 以 按照 英语 来 理解 while 语句 。 它 的 意思 是 : “每 当 n 
还 大 于 0 时 ， 显 示 n 的 值 ， 并 将 n 减 1。 当 n 变 成 0 的 时 候 ， 显 示 单 词 
Blastoff!. ” 





用 更 正式 的 说 法 ， 下 面 是 while 语句 执行 的 流程 。 





1. 确定 条 件 是 真 还 是 假 。 


2. 如 果 条 件 为 假 ， 退 出 while 语句 ， 并 继续 执行 后 面 的 语句 。 

3. 如 果 条 件 为 真 ， 则 运行 while 语句 的 语句 体 ， 并 返回 第 1 步 。 

这 种 类 型 的 流程 称 为 循环 doop) ， 因 为 第 3 步 又 循环 返回 到 最 顶 
端的 第 1 步 了 。 


循环 的 语句 体 里 面 应 当 修 改 一 个 或 多 个 变量 的 值 ， 以 致 循环 的 条 件 
最 终 能 变 成 假 ， 而 退出 循环 。 人 否则 这 个 循环 会 永远 重复 下 去 ， 这 样 的 情 
况 叫 作 无 限 循环 。 计 算 机 科学 家 在 读 到 洗 友 液 的 说 明 “ 浴 抹 、 冲 洗 、 重 
复 ? 时 ， 总 会 感到 有 趣 ， 因 为 这 是 一 个 无 限 循环 。 





在 countdown 这 个 例子 里 ， 我 们 可 以 证 明 循 环 必然 终结 : 如 果 n 
是 0 或 负数 ， 访 循环 从 不 运行 。 否 则 ，n 的 值 都 会 减 小 ， 因 此 最 终 n 会 变 
成 0。 





TREMA, IFA EMA DA TOU: 


def sequence(n): 
while n != 1: 











这 个 循环 的 条 件 是 n l= 1 ， 所 以 只 要 n 还 没有 变 成 1 而 导致 条 件 变 
假 ， 循 环 就 会 一 直 进 行 下 去 。 


每 一 个 循环 中 ， 程 序 输出 n 的 值 ， 并 检查 它 是 侦 数 还 是 奇数 。 如 果 


是 偶数 ，n 会 除 以 2。 如 果 是 奇数 ，n 会 被 替换 为 nk3+1 。 例 如 ， 如 果 传 
入 sequence 函数 的 参数 是 3， 则 n 的 结果 值 是 : 3, 10, 5, 16, 8, 4, 2,1. 


因为 n 有 时 候 增 加 ， 有 时 候 减 少 ， 没 有 办 法 找到 明显 的 证 据 确定 n 
一 定 会 最 终 变 成 1， 或 者 说 程序 会 终止 。 对 于 某 些 特定 的 n 值 ， 我 们 可 
以 证 明 最 终 会 终止 。 例 如 ， 如 果 开 始 的 参数 值 是 2 的 野 方 ， 则 每 次 循环 n 
都 是 侦 数 ， 下 到 变 成 1。 前 面 的 例子 中 有 一 部 分 就 是 这 样 的 序列 ， 以 16 
开始 。 








但 困难 的 问题 是 ， 我 们 是 否 能 够 证 明 这 个 程序 对 所 有 的 正 值 n 都 可 
以 最 终 终 止 。 至 今 为 止 ， 还 没有 人 对 这 个 问题 给 出 证 明 或 证 伪 ! (参见 


http://en.wikipedia.org/wiki/Collatz_ conjecture) 。 


作为 练习 ， 重 写 5.8 节 中 的 print_n 函数 ， 使 用 循环 而 非 递归 来 实 
现 。 


7.4 break 语句 





有 时 候 只 有 在 循环 语句 体 的 执行 途中 才能 知道 是 不 是 到 了 退出 循环 
的 时 机 。 这 时 候 可 以 使 用 break 语句 来 跳出 循环 。 


例如 ,假设 你 想 要 获得 用 户 输 入 ， 直 到 他 们 输入 done 。 可 以 这 么 


while True: 


line = input('> ') 

if line == 'done': 
break 

print(line) 


print('Done!') 





循环 的 条 件 是 True ， 总 是 为 真 ， 所 以 循环 会 一 直 运 行 ， 直 到 过 
到 break 语句 。 


每 次 循环 之 内 ， 都 会 先 用 一 个 尖 括 号 〈> ) 来 提示 用 户 输 入 。 如 果 
用 户 输入 done ，break 语句 会 退出 循环 。 人 否则 程序 会 显示 出 用 户 输入 
的 内 容 ， 并 重新 回 到 循环 的 项 端 。 这 里 是 一 个 运行 的 实例 : 
> not done 


not done 
> done 


Done! 








这 种 写 while 循环 的 方式 很 名 见 ， 因 为 可 以 把 判断 循环 条 件 的 逻辑 


放 在 循环 中 的 任何 地 方 《而 不 只 是 在 顶端 ) ， 并 且 可 以 以 肯定 的 语气 
来 表示 终结 条 件 (“ 当 这 样 发 生 时 集 止 循环 *) ， 而 不 是 否定 的 语气 
(“继续 执行 ， 直 到 那个 条 件 太 生 ”〉。 


755 VAR 


程序 中 第 种 使 用 循环 来 进行 数值 计算 ， 以 一 个 近似 值 开始 ， 并 迭代 
地 优化 计算 结 





例如 ， 计 算 平方 根 的 方法 之 一 是 牛顿 方法 。 假 设 你 想 要 知道 a 的 平 
方 根 。 如 果 你 以 任意 一 个 估计 值 x 开始， 可 以 使 用 如 下 的 方程 获得 一 个 
更 好 的 估计 值 。 


例如 ， 如 果 a 是 4 而 x 是 3: 


>>> a= 4 

>>> x = 3 

>>> y = (x + a/x) / 2 
>>> 


2.16666666667 





这 个 结果 更 接近 正确 的 答案 (V4 = 2) 。 如 果 我 们 使 用 新 的 估计 值 
重复 这 个 过 程 ， 会 得 到 更 近似 的 结 
>>> x = y 


>>> y = (x + a/x) / 2 
>>> y 


2.00641025641 





再 经 过 几 次 重复 更 新 ， 估 计 值 会 几乎 完全 准确 : 


>>> X 
>>> y 
>>> y 
2 . 00001024003 

>>> X = y 

>>> y = (x + a/x) / 2 
>>> y 

2 . 00000000003 


y 
(x + a/x) / 2 





通常 来 说 ， 我 们 并 不 能 提前 知道 需要 多 少 步 才 能 得 到 正确 的 答案 ， 
但 是 当 估 计 值 不 再 变化 时 ， 我 们 就 知道 达到 目的 了 。 


y 
(x + a/x) / 2 


y 
(x + a/x) / 2 





当 y == x 时 ， 可 以 终止 。 下 面 是 一 个 以 估计 值 x 开始 ， 并 不 断 先 
代 优化 直到 它 不 再 变化 的 循环 : 





while True : 
print(x) 
y = (x + a/x) / 2 
if y == x: 


break 
X = y 





对 于 大 多 数 a 值 来 说 ， 这 样 效 果 很 好 ， 但 通常 来 说 ， 测 试 float 的 
相等 是 危险 的 。 浮 点 数值 只 是 近似 正确 : 大 部 分 有 理 数 ， 如 1/3， 以 及 


无 理 数 ， 如 v2 ， 都 不 能 用 float 精确 表示 。 


比 起 判断 x 和 y 是 否 精 确 相 等 ， 更 安全 的 方式 是 利用 内 置 函 数 abs 
来 计算 它们 之 间 差 值 的 绝对 值 ， 或 者 说 量 级 : 


if abs(y-x) < epsilon: 
break 


这 里 epsilon 的 值 是 0.0000001， 用 来 决定 近似 度 是 足够 的 。 


7.6 ys 


牛顿 方法 是 算法 的 一 个 例子 : 它 是 解决 一 类 问题 的 机 械 化 过 程 
(在 这 个 例子 里 ， 问 题 是 计算 平方 根 〉。 





要 理解 算法 是 什么 ， 从 一 个 算 不 上 算法 的 东西 开始 可 能 更 简单 。 在 
学 习 个 位 数 相 乘 时 ， 你 可 能 背诵 过 乘法 表 。 实 际 上 ， 你 记 住 了 100 个 特 
别 的 答案 。 这 种 知识 不 算是 算法 。 





但 是 ， 如 果 你 比较 “ 懒 >”， 可 能 已 经 学 会 了 一 些小 技巧 来 偷懒 。 例 
如 ， 要 计算 n 和 9 的 乘积 ， 你 可 以 写 下 n -1 作为 十 位 数 ，10-n 作为 个 位 
数 。 这 个 小 技巧 是 计算 任意 个 位 数 和 9 的 乘积 的 通用 方案 。 这 算是 一 个 
算法 ! 





相似 地 ， 你 学 过 的 进位 加 法 、 借 位 减法 以 及 长 除法 都 是 算法 。 算 法 
的 特点 之 一 是 它们 不 需要 任何 聪明 才智 束 能 执行 。 它 们 是 一 个 机 械 化 的 
过 程 ， 其 中 每 一 步 都 依照 一 组 简单 的 规则 接着 上 一 步 进 行 。 


执行 算法 非 第 档 燥 ， 但 设计 算法 的 过 程 却 充 满 趣味 和 智力 挑战 ， 并 
且 是 计算 机 科学 的 一 个 核心 部 分 。 





一 些 人 们 目 然 而 然 、 坚 无 困难 或 者 下 意识 所 做 的 事情 ， 用 算法 表达 
却 最 为 困难 。 理 解 自 然 语 言 是 一 个 好 例子 。 我 们 都 能 理解 自然 语言 ， 但 
是 至 今 为 止 还 没有 人 能 解释 我 们 是 怎么 做 到 的 ， 人 至 少 没 办 法 用 算法 解 


释 。 











7.7 调试 





当 你 开始 编写 更 大 的 程序 时 ， 常 常会 发 现 自己 花费 更 多 的 时 间 用 于 
调试 。 更 多 的 代码 意味 着 更 多 的 出 错 机 会 ， 以 及 更 多 可 能 隐藏 者 bug 的 
地 方 。 








前 减 调 试 时 间 的 方法 之 一 是 “二 分 调试 ”(Cdebugging by 
bisection) 。 例 如 ， 如 果 你 的 程序 有 100 行 代码 ， 如 果 每 次 检查 一 行 ， 需 


要 100 步 。 





相反 地 ， 可 以 尝试 把 问题 分 成 两 半 。 找 到 程序 的 中 点 ， 或 者 接近 那 
里 的 地 方 ， 找 一 个 可 以 检验 的 中 间 结 果 。 添 加 一 个 print 语句 (或 者 其 
他 的 可 以 有 检查 效果 的 代码 ) 并 运行 程序 。 


如 果 中 点 检验 的 结果 是 错误 的 ， 说 明 错 误 必 然 出 现在 程序 的 前 半 部 
分 。 如 果 是 正确 的 ， 那 错误 则 在 程序 的 后 半 部 分 。 


每 进行 一 次 这 样 的 检查 ， 就 减少 了 一 半 需 要 检查 的 代码 。 经 过 6 步 
之 后 (显然 少 于 100 步 ) ， 就 能 够 减少 到 一 至 两 行 代码 ， 至 少 理论 上 如 
IH. 








实践 中 ， 常 常 很 难 确定 “程序 的 中 点 ”在 哪里 ， 并 且 并 不 总 是 能 够 检 
验 它 。 通 过 数 代 码 行 数 来 确定 中 点 显然 没有 意义 。 相 反 地 ， 应 当 思 考 程 
序 中 哪些 地 方 可 能 出 错 ， 哪 些 地 方 容易 加 上 一 个 检查 。 然 后 选择 一 个 你 
认为 在 其 前 后 发 生 错 误 概 率 差 不 多 的 点 进行 检查 。 








7:8 OA ye 





重新 赋值 (reassignment) : 对 一 个 已 经 存在 的 变量 赋予 一 个 新 
EC 


更 新 Cupdate) : 一 种 赋值 操作 ， 新 值 依 赖 于 变量 的 旧 值 。 


初始 化 (initialization〉: 一 种 赋值 操作 ， 给 变量 一 个 初始 的 值 ， 
以 后 可 以 进行 更 新 。 


增 量 (increment) : 一 种 更 新 操作 ， 增 加 变量 的 值 ( 常 常 是 加 
1) 。 


减 量 (decrement) : 一 种 更 新 操作 ， 减 少 变量 的 值 。 


WEAR Citeration) : 使 用 递归 函数 调用 或 者 循环 来 重复 执行 一 组 语 


无 限 循环 (infinite loop) : 一 个 终止 条 件 永 远 无 法 满足 的 循环 。 


算法 (algorithm) : 解决 一 类 问题 的 通用 过 程 。 


7.9 练习 


2 >] 7-1 


复制 7.5 节 的 循环 并 封装 到 一 个 名 为 square_root 的 函数 中 ， 这 个 
函数 接收 一 个 形 参 a 。 选 择 一 个 合理 的 值 x ， 并 返回 a 的 平方 根 的 估计 
值 。 





要 测试 这 个 方法 ， 可 以 编写 一 个 名 为 test_square_root 的 函数 ， 
打印 下 面 这 样 的 表格 : 


mysqrt(a) math.sqrt(a) 


421356237 


1. 

1. 
205080757 1.73205080757 

2. 

2. 


0 
41421356237 
73 
0 
.2369679775 2360679775 
2.44948974278 2.44948974278 
2.64575131106 2.64575131106 0.0 
2.82842712475 2.82842712475 4.4408920985e-16 
3.0 3.0 0.0 


a 

1.0 
2.0 
3.0 
4.0 
5.0 
6.0 
7.0 
8.0 
9.0 





第 一 列 是 一 个 数 ，a ; 第 二 列 是 数 a 的 平方 根 ， 使 用 mysqrt 函数 计 
算 ; 第 三 列 是 使 用 math.sqrt 计算 出 的 平方 根 第 四 列 是 两 种 计算 结果 
的 差 值 的 绝对 值 。 


练习 7-2 


内 置 函数 eval 接收 一 个 字符 串 并 使 用 Python 解释 器 对 它 进 行 求 


值 。 例 如 : 


>>> eval('1 + 2 * 3') 

7 

>>> import math 

>>> eval('math.sqrt(5)') 


2.2360679774997898 
>>> eval('type(math.pi)') 
<class 'float'> 





43 —-7 ek Bleval_loop, wR, PACT A HE 
用 eval 求 值 ， 并 打印 出 结果 。 


它 应 当 一 直 继 续 ， 直 到 用 户 输入 'done' ， 并 返回 最 后 一 个 求 值 的 
表达 式 的 结 
练习 7-3 


数学 家 拉 马 努 金 〈Srinivasa Ramanujan) 找到 了 一 个 无 限 序 列 ， 可 
以 用 来 生成 r 的 数值 近似 值 : 


1 272 QA (4k)!(1103 + 26390k) 


Oe | yas “dk 
7 9801 a (k!) 396 





编写 一 个 函数 estimate_pi ， 使 用 这 个 公式 计算 并 返回 r 的 近似 估 
计 。 它 应 当 使 用 一 个 while 循环 来 计算 求 和 的 每 一 项 ， 直 到 最 后 一 项 的 
值 小 于 le-15 〈 这 是 Python 对 10- 的 标记 法 ) 。 你 可 以 通过 和 math.pi 
比较 来 检查 计算 的 结果 。 


解答 : http://thinkpython2.com/code/pi.py。 


字符 串 和 整数 、 浮 点 数 以 及 布尔 类 型 都 不 同 。 字 符 串 是 一 个 序列 
(sequence) ， 即 它 是 一 个 由 其 他 值 组 成 的 有 序 集 合 。 本 章 中 你 将 见 到 
如 何 访问 构成 字符 串 的 各 个 字符 ， 并 学 到 字符 串 类 提供 的 一 些 方法 。 








8.1 FAR ET 


字符 串 是 一 个 字符 的 序列 Csequence) 。 可 以 使 用 方 括号 操作 符 来 
访问 字符 串 中 单独 的 字符 : 


>>> fruit = 'banana' 
>>> letter = fruit[1] 





第 二 个 语句 选择 fruit 中 的 第 1 个 字符 ， 并 将 它 赋值 给 letter & 





r 





方 括号 中 的 表达 式 称 为 下 标 Gndex) 。 下 标 表示 想 要 序列 中 的 哪 
一 个 字符 (所 以 用 index 这 个 名 称 ) 


但 你 可 能 发 现 得 到 的 和 预料 不 一 样 : 


>>> letter 
"g' 





对 大 多 数 人 来 说 ，'banana ' 的 第 一 个 字母 是 p ， 而 不 是 a 。 但 对 
计算 机 科学 家 来 说 ， 下 标 表 示 的 是 离 字 符 串 开头 的 偏 移 量 ， 而 第 一 个 字 
母 的 偏 移 量 是 0。 








>>> letter = fruit[@] 
>>> letter 


"b' 





所 以 b 是 'banana ' 的 第 0 个 字母 ，a 是 第 1 个 ，n 是 第 2 个 。 


可 以 使 用 包括 变量 和 操作 符 的 表达 式 作为 下 标 。 


>>>i=1 
>>> fruit[i] 
Le 


>>> fruit[i+1] 
'n' 





但 下 标的 值 必须 是 整数 ， 否 则 你 会 得 到 : 


>>> letter = fruit[1.5] 
TypeError: string indices must be integers 





8.2 len 


len 是 一 个 内 置 函 数 ， 返 回 字 符 串 中 字符 的 个 数 : 


>>> fruit = 'banana' 
>>> len(fruit) 


6 





要 获得 字符 串 的 最 后 一 个 字母 ， 你 可 能 会 想 这 么 写 : 


>>> length = len(fruit) 
>>> last = fruit[length] 
IndexError: string index out of range 





IndexError 出 现 的 原因 是 'banana' 中 没有 下 标 为 6 的 字母 。 因 为 
我 们 是 从 0 开始 计算 的 ，6 个 字母 的 下 标 是 0 到 5。 要 获得 最 后 一 个 字符 ， 
需要 从 length 里 减 1: 


>>> last = fruit[length-1] 
>>> last 


tat 





或 者 ， 你 可 以 使 用 负数 下 标 。 负 数 下 标 从 字符 串 结尾 处 倒 着 数 。 表 
达 式 fruit[-1] 返回 最 后 一 个 字母 ， 表 达 式 fruit[-2] 返回 倒数 第 二 
个 字母 ， 依 此 类 推 。 


8.3 ”使 用 for 循环 进行 遍历 


有 很 多 计算 都 涉及 对 字符 串 每 次 处 理 一 个 字符 的 操作 。 它 们 常常 从 
开头 起 ， 每 次 选择 一 个 字符 ， 对 它 做 一 些 处 理 ， 再 继续 ， 直 到 结束 。 这 
种 处 理 的 模式 ， 我 们 称 为 遍历 (traversal) 。 编 写 遍 历 逻 辑 的 方法 之 一 
是 使 用 while 循环 : 


index = 6 

while index < len(fruit): 
letter = fruit[ index] 
print(letter) 


index = index + 1 








这 个 循环 过 历 字符 串 ， 并 将 每 个 字符 显示 在 单独 的 一 行 上 。 循 环 的 
结束 条 件 是 jndex < len(fruit), ， 所 以 当 index 等 于 字符 串 的 长 度 
时 ， 条 件 为 假 ， 循 环 体 不 被 运行 。 最 后 访问 的 字符 下 标 
为 len(fruit)-1， 正 好 是 字符 串 最 后 一 个 字符 。 











作为 练习 ， 写 一 个 函数 ， 接 收 一 个 字符 串 作 为 形 参 ， 并 倒序 显示 它 
的 字母 ， 每 个 字母 单独 一 行 。 


Ey A Pe HE for 循环 : 


for letter in fruit: 
print(letter) 





BEUIBIN ZH, FPP R- AFFERRARE letter 。 


循环 会 继续 直到 没有 剩余 的 字符 为 止 。 





下 面 的 示例 展示 了 如 何 利用 字符 串 拼接 (字符 串 加 法 ) 和 一 个 for 
循环 来 生成 字母 序列 (也 就 是 ， 按 字母 顺序 排序 的 序列 ) 。 在 Robert 
MecCloskey 的 书 《 为 小 鸭 让 路 》 (Make Way for Ducklings ) 中 ， 小 鸭 们 
的 名 字 是 Jack、Kack、Lack、Mack、Nack、Ouack、Pack 及 Quack。 下 
面 的 循环 按 顺 序 输出 这 些 名 字 : 








prefixes = 'JKLMNOPQ' 
suffix = ‘ack' 


for letter in prefixes: 
print(letter + suffix) 





当然 那 并 不 完全 正确 ， 因 为 “Ouack” 和 “Quack” 拼 写 错 了 。 作 为 练 
习 ， 修 改 程 序 解 决 这 个 问题 。 





8.4 FAV 


字符 串 中 的 一 段 称 为 一 个 切片 〈slice) 。 选 择 一 个 切片 和 选择 一 个 
字符 类 似 : 


>>> s = ‘Monty Python' 
>>> s[@:5] 

"Monty ' 

>>> s[6:12] 


"Python' 





操作 符 [n:m] 返回 字符 串 从 第 n 个 字符 到 第 m 个 字符 的 部 分 ， 包 合 
第 n 个 字符 ， 但 不 包含 第 m 个 字符 。 这 个 行为 有 些 违反 直觉 ， 但 如 果 想 
象 下 标 是 指 问 字 符 之 间 的 位 置 ， 可 以 帮助 我 们 理解 它 ， 如 图 8-1 所 示 。 


ti — banana’ 
index 0 12 3 4 5 6 


图 8-1 切片 的 下 标 





如 果 省 略 掉 第 一 个 下 标 〈 冒 号 之 前 的 那个 ) ， 切 片 会 从 字符 串 开 头 
开始 。 如 果 省 略 掉 第 二 个 下 标 ， 切 片 会 继续 到 字符 串 的 结尾 。 
>>> fruit = 'banana' 


>>> fruit[ :3] 
'ban' 


>>> fruit[3:] 
"ana' 





如 有 果 第 一 个 下 标 大 于 或 等 于 第 二 个 下 标 ， 结 果 是 空 字 符 串 ， 用 两 
个 引号 表示 : 


>>> fruit = 'banana' 
>>> fruit[3:3] 





空 字符 串 不 包含 任何 字符 ， 长 度 为 0， 但 除 此 之 外 ， 它 和 其 他 字符 
HE. 


继续 本 例 ， 你 认为 fruit[ : ] 表示 什么 ? 尝试 一 下 看 看 结果 。 





8.5 PPB eA GAY 
想 要 修改 字符 串 的 某 个 字符 ， 你 可 能 会 想 直接 在 赋值 左 侧 使 用 [] 
操作 符 。 例 如 : 


>>> greeting = 'Hello, world!' 
>>> greeting[@] = 'J' 


TypeError: ‘str' object does not support item assignment 





这 个 例子 里 的 “对 象 ”(object) 是 字符 串 ， 而 “项 ” (item) 是 指 你 想 
要 赋值 的 那个 字符 。 就 现在 来 说 ， 一 个 对 象 和 值 是 差不多 的 东西 ， 但 
我 们 会 在 后 面 细 谈 它 (参见 10.10 节 ) 。 








这 个 错误 产生 的 原因 是 因为 字符 串 是 不 可 变 (immutable) 的 ， 也 


就 是 说 ， 不 能 修改 一 个 已 经 存在 的 字符 串 。 你 能 做 的 最 多 是 新 建 一 个 字 
符 串 ， 它 和 原来 的 字符 串 稍 有 不 同 : 








>>> greeting = ‘Hello, world!’ 
>>> new_greeting = 'J' + greeting[1: ] 
>>> new_greeting 


"Jello, world!' 








这 个 例子 使 用 新 的 首 字符 和 greeting 的 一 个 切片 拼接 起 来 。 它 对 
原来 的 字符 串 没有 影响 。 


8.6 EZR 


下 面 的 这 段 函 数 是 做 什么 的 ? 


def find(word, letter): 
index = 6 
while index < len(word): 
if word[index] == letter: 


return index 
index = index + 1 
return - 1 





从 茶 种 意义 上 说 ，find 是 [] 操作 符 的 反面 。 和 [ ] 操作 符 通 过 一 个 
下 标 碍 找 对 应 的 字符 不 同 ， 它 根据 一 个 字符 得 找 其 出 现在 字符 串 中 的 下 
标 。 如 琳 没 有 找到 字符 ， 函 数 返 回 -1 。 





这 是 我 们 第 一 次 在 循环 内 部 看 到 return 语句 。 如 果 word[index] 
== letter ， 函 数 直接 跳出 循环 并 立即 返回 


如 果 字 符 没 有 出 现在 字符 串 中 ， 程 序 正 常 退出 循环 ， 并 返回 -1 


这 种 计算 的 模式 一 一 般 历 一 个 序列 ， 并 当 找 到 我 们 寻找 的 目标 时 返 
称 为 搜索 。 





作为 练习 ， 修 改 find 函数 ， 让 和 它 接收 第 3 个 形 参 ， 表 示 从 word 的 
哪个 下 标 开 始 搜索 。 


8.7 ”循环 和 计数 


下 面 的 代码 计算 字母 a 在 字符 串 中 出 现 的 次 数 : 


word = 'banana' 
count = @ 
for letter in word: 
if letter == 'a': 
count = count + 1 


print(count) 











IX“ REE RAN SFP ES, PRATT Bas 。 变 量 count 初始 
化 为 0， 接 着 每 次 找到 一 个 a Wit Bs. KAER, count 保存 
着 结果 一 一 a 出 现 的 总 次 数 。 


作为 练习 ， 将 这 段 代码 封 效 成 函数 count ， 并 泛 化 它 以 接收 字符 串 
和 要 计数 的 字母 作为 形 参 。 





RAE count 孙 数 ， 不 直接 遍历 字符 串 ， 而 是 使 用 前 面 一 节 中 的 
3 形 参 版 本 的 find 函数 。 


8.8 1 TTIE 


字符 串 提 供 了 很 多 完成 各 种 操作 的 有 用 的 方法 。 方 法 和 函数 很 相 
似 一 一 它 接收 形 参 并 返回 值 一 一 但 语法 有 所 不 同 。 例 如 ， 方 法 upper 接 
收 一 个 字符 串 ， 并 返回 一 个 全 部 字母 都 是 大 写 的 字符 串 。 








和 函数 的 语法 upper(word) 不 同 ， 它 使 用 方法 的 调用 语法 
word.upper() 。 


>>> word = 'banana' 
>>> new_word = word.upper() 
>>> new_word 


"BANANA" 





这 种 句点 表示 法 指定 了 方法 的 名 称 ， 以 及 方法 应 用 到 的 字符 串 的 名 
称 word 。 空 的 括号 表示 这 个 方法 没有 任何 参数 。 


方法 的 调用 称 为 invocation l; 在 这 个 例子 里 ， 我 们 说 我 们 
在 word 字符 串 上 调用 方法 upper 。 





实际 上 ， 字 符 串 本 来 就 有 一 个 方法 find ， 和 我 们 之 前 写 的 find K 
数 非常 相似 : 


>>> word = 'banana' 
>>> index = word. find('‘a') 
>>> index 


1 





在 这 个 例子 中 ， 我 们 在 word 上 调用 find 方法 ， 并 传 入 要 查找 的 字 
母 作为 实 参 。 





实际 上 ，find 方法 比 我 们 的 函数 更 通用 ; 它 可 以 用 来 查找 子 字符 
串 ， 而 不 仅仅 是 字符 : 


>>> word.find('na') 
2 


默认 情况 下 ，find 在 字符 串 的 开始 局 动 ， 但 它 还 可 以 接收 第 二 个 
实 参 ， 表 示 从 哪 一 个 下 标 开始 俘 找 : 








>>> word.find('na', 3) 
4 


这 是 可 选 参数 的 一 个 示例 。find 还 可 以 接收 第 三 个 实 参 ， 表 示 查 
找到 哪个 下 标 融 结束 : 


>>> name = 'bob' 
>>> name.find('b', 1, 2) 


-1 





这 个 搜索 失败 ， 因 为 b 并 没有 在 字符 串 的 下 标 1 到 2 之 间 《〈 不 包括 
2) 出 现 。find 在 搜索 时 只 搜索 到 第 二 个 (但 不 包括 第 二 个 ) 下 标 为 
止 ， 这 使 find 和 切片 操作 符 的 行为 一 致 。 


8.9 ”操作 符 in 


in 是 一 个 布尔 操作 符 ， 操 作 于 两 个 字符 串 上 ， 如 果 第 一 个 是 第 二 
个 的 子 串 ， 则 返回 True ， 否 则 返回 False : 


>>> 'a' in 'banana' 
True 
>>> 'seed' in '‘banana' 


False 





例如 ， 下 面 的 函数 打印 出 word1 中 出 现 且 出 现在 word2 中 的 所 有 字 
ft: 


def in_both(word1, word2): 
for letter in word1: 
if letter in word2: 
print(letter) 





精心 选择 变量 名 称 后 ，Python 有 时 会 读 起 来 很 像 英语 。 可 以 这 样 读 
这 个 循环 : “for (each) letter in (the first) word, if (the) letter (appears) in 


(the second) word, print (the) letter”. 
下 面 是 用 这 个 函数 比较 单词 apples 和 oranges 的 结 


>>> in_both('apples', "oranges ) 





8.10 FIFE E 


关系 操作 符 也 可 以 用 在 字符 串 上 。 检 查 两 个 字符 串 是 否 相 等 : 


if word == 'banana': 
print('All right, bananas." ) 











其 他 的 关系 操作 符 在 将 单词 按照 字母 顺序 比较 时 有 用 : 


if word < 'banana': 

print('Your word,’ + word + ', comes before banana. ') 
elif word > ‘banana’: 

print('Your word,' + word + ', comes after banana.' ) 


else: 
print('All right, bananas." ) 








Python 处 理 大 小 写字 母 时 和 人 处 理 时 不 一 样 。 所 有 的 大 写字 母 都 在 
小 号 字母 之 前 。 所 以 : 


Your word, Pineapple, comes before banana. 


处 理 这 个 问题 的 常用 办 法 是 先 将 字符 串 都 转换 为 标准 的 形式 ， 如 都 
转换 成 全 小 写字 母 形 式 ， 再 进行 比较 。 如 果 你 遇 到 一 个 武装 着 Pineapple 
的 敌人 需要 保护 自己 时 ， 请 记 住 这 个 办 法 。 


8.11 调试 


当 使 用 下 标 来 遍历 序列 中 的 值 时 ， 要 正确 实现 遍历 的 开端 和 结尾 并 
Toa Da pa 数 ， 能 够 比较 两 个 单词 ， 如 果 和 它们 互 为 倒序 ， 则 
返回 True ， 但 这 个 函数 包含 了 两 个 错误 : 





def is_reverse(word1, word2): 
if len(word1) != len(word2): 
return False 
= 0 
= ] 


en(word2) 


i 
j 


while j > 0: 
if word1[i] != word2[j]: 
return False 
i 
j 


i+1 
j-1 


return True 





第 一 个 if Ee A ne 如 果 不 同 ， 我 们 就 立 
ibaa aca 否则 在 后 面 整个 函数 中 ， 痢 可 以 认为 两 个 单词 是 相同 长 
度 的 。 这 是 6.8 市 ea 个 实例 。 


i 和 j 是 下 标 : i 用 于 正 向 遍历 word1 ， 而 j 用 于 反 向 遍历 word2 。 
如 果 我 们 找到 两 个 不 匹配 的 字母 ， 则 可 以 立即 返回 False 。 如 果 完 成 整 
个 循环 后 所 有 的 字母 仍然 都 相等 ， 则 返回 True 。 





如 果 使 用 单词 “pots” 和 “stop” 来 测试 这 个 函数 ， 我 们 会 预期 返回 值 
是 True， ei 


>>> is_reverse('pots', '‘stop') 


File "“reverse.py", line 15, in is reverse 
if word1[i] != word2[j]: 
IndexError: string index out of range 








为 了 调试 这 类 错误 ， 第 一 步 可 以 在 发 生 错 误 的 那 行 代 码 之 前 打印 出 
索引 的 值 。 


while j > 0: 
print i, j # 在 这 里 打印 























if word1[i] != word2[j]: 
return False 





这 样 再 一 次 运行 程序 时 ， 能 获得 更 多 的 信息 : 


>>> is reverse('pots', 'stop') 
04 


IndexError: string index out of range 





第 一 次 迭代 时 ，j 的 值 是 4， 超 出 了 "pots ' 的 范围 。 最 后 一 个 字符 
的 下 标 是 3， 所 以 j 的 初始 值 应 该 是 len(word2)-1 。 


如 果 修 改 这 个 错误 并 重新 运行 程序 ， 会 得 到 : 





>>> is_reverse('pots', '‘stop') 


True 


这 回 我 们 得 到 了 正确 的 结果 ， 但 看 起 来 循环 只 运行 了 3 次 ， 有 些 可 
疑 。 为 了 对 具体 发 生 了 什么 有 更 清晰 的 印象 ， 可 以 画 一 个 状态 图 。 第 一 
个 迭代 中 ，is_reverse 的 帧 显示 在 图 8-2 中 。 





wordi —> ’pots’ word2 —> ’stop’ 


a’ (3 





Al8-2 ”状态 图 


我 特意 安排 了 帧 中 变量 的 位 置 ， 并 使 用 虚线 来 显示 i Mj 指 
向 word1 和 word2 中 的 字符 。 





从 这 个 图 开始 ， 在 纸 上 运 行程 序 ， 每 个 迭代 修改 Mj 的 值 。 找 到 
并 修复 这 个 函数 的 第 二 个 错误 。 


8.12 NEK 


对 象 Cobject) : 变量 可 以 引用 的 一 种 事物 。 就 现在 来 说 ， 可 以 
把 “对 象 ” 当 作 “ 值 ”来 使 用 。 


序列 (sequence) : 一 个 有 序 的 值 的 集合 ， 其 中 每 个 使 用 一 个 下 标 
来 定位 。 


项 (item) : 序列 中 的 一 个 值 。 


下 标 《index) : 用 于 在 序列 中 选择 元 素 的 整数 值 。 例 如 ， 可 以 用 
于 在 字符 串 中 选取 字符 。 在 Python 中 下 标 从 0 开始 。 


切片 (slice) : 字符 串 的 一 部 分 ， 通 过 一 个 下 标 范 围 来 定位 。 


TFP (empty string) : 没有 字符 ， 长 度 为 0 的 字符 串 ， 使 用 一 
对 引号 来 表示 。 





不 可 变 Gmmutable) : 厅 列 的 一 种 属性 ， 表 示 它 的 元 素 是 不 可 以 
改变 的 。 


WJ (traverse) : 迭代 访问 序列 中 的 每 一 个 元 素 ， 并 对 每 个 元 素 
进行 相似 的 操作 。 





搜索 (search) : 一 种 遍历 的 模式 ， 当 找到 它 想 要 的 元 素 时 停止 。 


计数 器 (counter) : 一 种 用 来 计数 的 变量 ， 通 常 初始 化 为 0， 后 来 


会 递增 。 


方法 调用 (invocation) : 调用 一 个 方法 的 语句 。 


可 选 参数 (optional argument) : 函数 或 方法 中 ， 并 不 必须 有 的 参 
数 。 


8.13 练习 


2 >] 8-1 


7Ehttp://docs.python.org/3/library/stdtypes. html#string-methods |i] i F- 
符 串 方法 的 文档 。 你 可 能 会 想 实 验 一 下 其 中 的 一 些 方法 ， 以 确保 自己 理 
解 了 它们 的 工作 方式 。strip 和 replace 特别 有 用 。 


文档 中 使 用 了 一 种 可 能 会 引起 困惑 的 语法 。 例 如 ，find(sub[， 
start[, end]]) 中 的 方 插 号 表示 可 选 的 参数 。 所 以 sub 是 必需 的 ， 但 
是 start 是 可 选 的 ， 并 且 如 果 使 用 了 start ， 则 end 是 可 选 的 。 


练习 8-2 





有 一 个 字符 串 方法 叫 作 count ， 和 我 们 之 前 在 8.9 节 中 展示 的 方法 
类 似 。 阅 读 这 个 方法 的 文档 ， 并 写 一 个 程序 调用 它 来 计算 'banana' 中 a 
出 现 的 次 数 。 


练习 8-3 


字符 串 切 片 可 以 接受 第 三 个 下 标 用 来 指定 “ 步 长 ”， 即 相 邻 的 字符 之 
间 的 距离 。 步 长 为 2， 意 思 是 切片 每 次 取 接 下 来 第 2 个 字符 ; 步 长 3 意思 
是 每 次 取 接 下 来 第 3 个 字符 ， 等 等 。 

















>>> fruit = 'banana' 
>>> fruit[6:5:2] 
'bnn' 





步 长 为 -1 表示 切片 按照 相反 的 方 癌 访问 字符 串 ， 所 以 切片 [::-1] 
aah Bll — TSU FT 





使 用 这 个 特性 来 编写 一 个 一 行 版 本 的 js_palindrome pe 2 IZK 
~J6-3) 。 


练习 8-4 





Po AY 


字符 串 是 否 包 含 小 写字 母 ， 但 


错误 的 。 对 每 个 函数 ， 描 述 一 下 这 个 函数 到 撒 做 了 什么 
(假设 形 参 是 一 个 字符 串 )。 


下 面 的 几 个 函数 目的 都 是 检查 一 1 
至 少 有 一 个 是 





def any_lowercase1(s): 





for c in s: 


if c.islower(): 
return True 
else: 


return False 
def any_lowercase2(s): 
for c ins: 
if 'c'.islower(): 


return 


"True' 
else: 


return ‘False’ 


def any_lowercase3(s): 
for c ins: 
flag = c.islower() 
return flag 


def any_lowercase4(s): 
flag = False 
for c ins: 


flag = flag or c.islower() 
return flag 


def any_lowercase5(s): 
for c ins: 


if not c.islower(): 


return False 
return True 


2 >] 8-5 


凯撒 密码 (Caesar Cypher) 是 一 个 比较 弱 的 加 密 形 式 ， 它 涉及 将 单 
词 中 的 每 个 字母 “轮转 ”固定 数量 的 位 置 。 轮 转 一 个 字母 意思 是 在 字母 表 
中 移动 它 ， 如 果 需 要 ， 再 从 开头 开始 。 所 以 ‘A’ 轮 转 3 个 位 置 是 'D)， 
而 ‘2Z’ 轮 转 一 个 位 置 是 ‘A’。 











要 对 一 个 单词 进行 轮转 操作 ， 对 其 中 每 一 个 字母 进行 轮转 即 可 。 例 
如 ,， “cheer 轮 转 7 位 的 结果 是 “*jolly”， 而 “melon” 轮 转 -10 位 结 
是 “cubed”。 在 电影 《2001 太 空 漫游 》 中 ， 舰 载 机 器 人 叫 作 HAL， 这 个 
单词 正 是 IBM 轮 转 -1 位 的 结果 。 


编写 一 个 函数 rotate_word ， 接 收 一 个 字符 串 以 及 一 个 整数 作为 
参数 ， 并 返回 一 个 新 字符 串 ， 其 中 的 字母 按照 给 定 的 整数 值 “轮转 ”位 
置 。 


你 可 以 使 用 内 置 函 数 ord ， 它 能 够 将 一 个 字符 转换 为 数值 编码 ， 以 
及 函数 chr ， 它 将 数值 编码 转换 为 字符 。 了 字母 表 中 的 字母 是 按照 字母 顺 
序 编码 的 ， 所 以 ， 例 如 : 








>>> ord('c') - ord('a') 
2 


因为 'c' 在 字母 表 中 的 下 标 是 2。 但 是 请 注意 : 大 写字 母 的 数字 编 





码 是 不 同 的 。 


因特网 上 有 些 可 能 冒犯 人 的 笑话 是 用 ROT13 编 码 的 。ROT13 是 轮转 
13 位 的 凯撒 密码 。 如 果 你 不 容易 被 冒犯 ,可 以 寻找 一 些 并 解码 。 


解答 : http://thinkpython2.com/code/rotate.py。 





[1] 普通 函数 的 调用 ， 称 为 cal1 。 一 一 译 者 注 


本 章 介 绍 第 二 个 案例 分 析 ， 讲 述 的 是 通过 搜索 具有 菏 种 特性 的 单词 
来 解决 单词 谜 题 这 一 话题 。 例 如 ， 我 们 会 寻找 英语 单词 中 最 长 的 回 文 单 
词 ， 还 会 搜索 那些 其 字母 按照 字母 表 顺 序 排列 的 单词 。 另 外 ， 我 会 介绍 
另 一 种 程序 开发 计划 : 缩减 问题 规模 ， 回 归 成 之 前 解决 过 的 问题 。 





91 读 取 单词 列表 


为 本 章 的 练习 ， 我 们 需要 准备 一 个 英文 单词 列表 。 互 联网 上 有 很 多 
可 用 的 单词 列表 ， 但 最 适合 我 们 的 目标 的 单词 列表 ， 是 由 Grady Ward 收 
集 整理 并 作为 Moby 词 典 项 目 〈 参 看 
http://wikipedia.org/wiki/Moby_Project) 的 一 部 分 贡献 给 公共 域 的 。 它 包 
含 113 809 个 正式 的 填 字 游戏 用 词 ， 即 那些 认为 可 以 用 于 纵横 填 字 游戏 
和 其 他 类 型 文字 游戏 的 单词 。 在 Moby 集 合 中 ， 文 件 名 是 113869of .fic 
; Fy LA Mhttp://thinkpython.com/code/words. txt 下 载 一 个 副本 ， 但 文件 名 
是 更 简单 的 words .txt 。 








这 个 文件 是 纯 文 本 ， 所 以 可 以 使 用 文本 编辑 器 打开 ， 也 可 以 使 用 
Python 读 入 它 。 内 置 函 数 open 接收 文件 名 作为 参数 ， 并 返回 一 个 文件 
对 象 (file object) ， 可 以 用 来 读 取 文 件 。 


>>> fin = open('words.txt') 


Fin 是 用 来 表示 文件 对 象 作为 输入 源 时 常用 的 名 称 。 文 件 对 象 提供 
了 几 个 方法 用 于 读 取 内 容 ， 包 括 readline ， 它 会 从 文件 里 读 入 字符 ， 
直到 获得 换行 符 为 止 ， 并 将 读 入 的 结果 作为 一 个 字符 串 返 回 : 


>>> fin.readline() 
‘aa\r\n' 


在 这 个 特定 的 列表 中 ， 第 一 个 单词 是 "aa"， 它 是 一 种 火山 熔岩 。 序 





列 \r\n 表示 两 个 空格 字符 ， 一 个 是 回 车 ， 一 个 是 换行 ， 用 于 把 这 个 单 
词 和 其 他 单词 分 隔 开 。 


文件 对 象 会 记录 它 读 到 文件 的 哪个 位 置 ， 因 此 如 果 再 次 调 
用 readline ， 会 得 到 下 一 个 单词 : 


>>> fin.readline() 
‘aah\r\n' 





下 一 个 单词 是 "aah"， 也 是 一 个 完全 合法 的 单词 ， 所 以 别 用 奇怪 的 
眼光 看 着 我 。 或 者 ， 如 果 是 那 几 个 空白 字符 在 干扰 你 ， 可 以 使 用 字符 串 
的 方法 strip 去 掉 它们 : 





>>> line = fin.readline() 
>>> word = line.strip() 
>>> word 

“aahed 





你 也 可 以 在 for 循环 中 使 用 文件 对 象 。 下 面 的 代码 读 入 words .txt 
并 每 行 打印 出 一 个 单词 : 
fin = open('words.txt') 


for line in fin: 
word = line.strip() 


print(word) 





9.2 练习 


在 下 一 节 里 有 这 些 练习 的 解答 。 在 继续 阅读 解答 之 前 ， 应 当 至 少 党 
试 一 下 每 一 个 练习 。 


练习 9-1 


编写 一 个 程序 ， 读 入 words .txt 并 且 打 印 出 那些 长 度 超 过 20 个 字符 
的 单词 〈 不 算 空 白字 符 ) 。 


练习 9-2 


1939 年 ，Emest Vincent Wright 出 版 了 一 本 5 万 字 的 小 说 Gadsby ， 这 
本 书 里 没有 包含 字母 “e"。 因 为 “e" 是 英语 中 最 第 见 的 字母 ， 所 以 这 并 不 
是 件 容 易 的 事 。 


实际 上 ， 不 使 用 这 最 常见 的 字母 的 话 ， 仪 仅 是 构建 一 条 单独 的 构思 
也 是 很 难 的 事情 。 开 始 时 会 很 慢 很 艰难 ， 但 保持 谨慎 和 长 时 间 的 训练 ， 
你 可 以 渐渐 掌握 方法 。 


好 吧 ， 我 先 停 下 来 。 H 


写 一 个 函数 has_no_e ， 当 给 定 的 单词 不 包含 字母 “e" 时 ， 返 回 True 


修改 前 一 节 练 习 中 的 代码 ， 打 印 出 不 含 “e” 的 单词 ， 并 计算 这 种 单 
词 在 整个 单词 表 中 的 百分比 。 


2 >] 9-3 


编写 一 个 函数 avoids ， Ss 以 及 一 个 包含 禁止 字母 的 
字符 串 ， 当 单词 不 含 任何 禁止 字母 时 ， 返 回 True 。 


修改 你 的 程 计 ， 提 示 用 户 输入 包含 禁止 字母 的 字符 串 ， 并 打印 出 不 
包含 任意 禁止 字母 的 单词 的 个 数 。 能 不 能 找到 一 组 5 个 禁止 字母 的 组 
合 ， 它 们 排除 的 单词 最 少 ? 











练习 9-4 


编写 一 个 名 为 uses_only 的 函数 ， 接 收 一 个 单词 以 及 字母 组 成 的 字 
符 串 ， 当 单词 只 由 这 些 字 母 组 成 时 返回 True 。 你 可 以 造 一 个 句子 ， 其 
单词 只 由 字母 acefhlo 组 成 吗 ? 除了 “Hoealfalfa” 之 外 呢 ? 


练习 9-5 


编写 一 个 名 为 uses_all 的 函数 ， 接 收 一 个 单词 以 及 由 需要 的 字母 
组 成 的 字符 串 ， 当 单词 中 所 有 需要 的 字母 都 出 现 了 至 少 一 次 时 返回 True 
。 有 多 少 单词 使 用 了 所 有 的 元 音字 母 aeiou ? 而 aeiouy W? 





练习 9-6 


编写 一 个 名 叫 ijs_abecedarian 的 函数 ， 如 果 单 词 中 的 字母 是 按照 
字母 表 顺 序 排列 的 〈 两 个 重复 字母 也 可 以 ) ， 则 返回 True 。 有 多 少 这 
样 的 单词 ? 


9.3 ER 


前 面 一 市 的 所 有 练习 都 有 一 个 共同 点 ;它们 可 以 使 用 我 们 在 8.6 市 
中 介绍 的 搜索 模式 来 解决 。 最 简单 的 例子 是 : 


def has_no_e(word): 
for letter in word: 
if letter == 'e': 


return False 
return True 





for 循环 遍历 单词 word 中 的 字符 。 如 果 我 们 找到 字母 <e”， 可 以 立 
即 返 回 False ; 否则 只 能 继续 下 一 个 字母 。 如 果 正 常 退出 了 循环 ， 则 说 
明 我 们 没有 找到 “e”， 所 以 返回 True 。 


使 用 in 操作 符 ， 可 以 把 这 个 函数 写 得 更 简洁 。 上 面 这 个 示例 没有 
写 得 更 简洁 是 因为 想 要 展现 搜索 模式 的 逻辑 。 








avoids 是 has_no_e 的 更 通用 的 版 本 ， 它 们 的 结构 相同 : 


def avoids(word, forbidden): 
for letter in word: 
if letter in forbidden: 


return False 
return True 





一 旦 发 现 一 个 禁止 的 字母 ， 可 以 立即 返回 False ; 如 果 运 行 到 循环 
结束 ， 则 返回 True 。 


uses only 函数 也 类 似 ， 只 是 它 条 件 判 断 的 意思 是 相反 的 : 


def uses_only(word, available): 
for letter in word: 
if letter not in available: 


return False 
return True 








它 接收 的 参数 并 不 是 一 个 禁止 字母 列表 ， 而 是 一 个 可 用 字母 列 
#available 。 如 果 我 们 发 现 单 词 中 遇 到 了 并 不 属于 available 的 字 
母 ， 则 可 以 返回 False 。 





uses_all 函数 也 类 似 ， 但 单词 和 字母 列表 的 角色 相反 。 


def uses_all(word, required): 
for letter in required: 
if letter not in word: 


return False 
return True 








我 们 不 再 遍历 单词 word 中 的 字母 ， 而 是 循环 遍历 必需 的 单词 列 
表 required 。 如 果 单 词 列表 中 有 任意 字母 没有 出 现在 单词 中 ， 我 们 可 
以 返回 False 。 














如 果 你 真 的 像 计算 机 科学 家 那样 思考 的 话 ， 应 该 已 经 发 
Hl, uses all 实际 上 是 已 经 解决 的 问题 的 一 个 特例 ， 并 且 可 以 这 么 


J 


写 : 


def uses_all(word, required): 
return uses_only(required, word) 


| 


这 是 被 称 为 将 问题 回归 到 已 解决 问题 (reduction to a previously 
solved problem) 的 程序 开发 计划 的 一 个 例子 。 意 即 你 需要 识别 出 的 当前 
问题 是 一 个 已 经 解决 的 问题 的 特例 ， 从 而 可 以 直接 利用 现 有 的 解决 方 


Ro 


9.4 使 用 下 标 循环 





在 前 面 一 节 的 例子 中 ， 我 使 用 for 循环 进行 遍历 ， 因 为 只 需要 字符 
串 中 的 字符 ， 而 不 需要 操作 下 标 。 


但 对 is_abecedarian 函数 我 们 需要 比较 相 邻 的 字母 ， 使 用 for 循 
环比 较 困难 : 


def is abecedarian(word): 
previous = word[@] 
for c in word: 
if c < previous: 


return False 
previous = c 
return True 





或 者 也 可 以 使 用 递归 : 


def is abecedarian(word): 
if len(word) <= 1: 
return True 
if word[@] > word[1]: 
return False 
return is_abecedarian(word[1: ]) 





还 有 一 个 办 法 是 使 用 while 循环 : 





def is abecedarian(word): 
i= 6 
while i < len(word)-1: 
if word[i+1] < word[i]: 
return False 


i = i+1 
return True 





循环 开始 于 i=6， 并 结束 于 i=len (word)-1。 每 次 迭代 时 ， 比 较 





第 i 个 字符 (可 以 看 成 是 当前 字符 和 第 i+1 个 字符 (可 以 看 成 是 下 一 个 
FR) o 


如 果 下 一 个 字符 比 当前 字符 小 〈 即 按照 字母 顺序 在 前 ) ， 则 我 们 发 
现 了 一 个 破坏 字母 顺序 的 断 点 ， 可 以 返回 False 。 


如 果 我 们 没有 找到 任何 断后 而 结束 循环 ， 则 这 个 单词 通过 了 测试 。 
为 了 说 服 目 己 循环 是 正确 结束 的 ， 可 以 考虑 像 'flossy' 这 样 的 例子 。 
这 个 单词 的 长 度 是 6， 所 以 最 后 一 次 循环 时 i 是 4， 即 是 倒数 第 二 个 字符 
的 下 标 。 在 最 后 一 个 循环 中 ， 会 比较 倒数 第 二 个 和 最 后 一 个 字符 ， 这 正 
是 我 们 所 期 等 的 。 


下 面 是 is_palindrome 函数 “〈 人 参考 练 习 6-3) 的 一 个 版 本 ， 它 使 用 
两 个 下 标 ;， 一 个 从 0 开始 递增 ; 男 一 个 从 最 后 开始 递减 。 


def is_palindrome(word): 
i= 6 
j = len(word)-1 


while i<j: 
if word[i] != word[j]: 
return False 
i+1 
j-1 


i 
J 


return True 





或 者 ， 我 们 可 以 将 其 回归 到 已 经 解决 的 问题 ， 可 能 这 么 与 : 


def is_palindrome(word): 
return is_reverse(word, word) 





使 用 练习 8-2 中 的 is_reverse 。 


9.5 ”调试 


测试 程序 很 难 。 本 章 中 的 函数 相对 容易 测试 ， 因 为 可 以 简单 地 手动 
验证 结果 。 即 便 如 此 ， 要 选择 一 组 可 以 测试 到 所 有 可 能 的 错误 的 单词 ， 
也 是 很 困难 的 ， 甚 至 是 不 可 能 的 。 


举 has_no_e 作为 例子 ， 有 两 个 很 明显 的 用 例 可 以 检测 : 包含 “e” 的 
单词 应 该 返回 False ; 不 包含 “e” 的 应 当 返 回 True 。 为 这 两 种 情况 找到 
具体 的 单词 没有 问题 。 


但 对 每 种 情况 来 说 ， 也 存在 一 些 不 那么 明显 的 具体 情况 。 在 所 有 包 
合 “e” 的 单词 中 ， 你 应 当 测 斌 以"e" 开 头 的 单词 ， 也 应 当 测 试 以 <e” 结 尾 ， 
以 及 “e" 在 单词 中 部 的 情况 。 你 应 当 测 试 长 单词 、 短 单词 及 非常 短 的 单 
词 ， 如 空 字 符 串 。 空 字符 串 是 特殊 情形 (special case) 的 一 个 例子 。 特 
殊 情 形 往往 不 那么 明显 ， 但 又 种 各 隐藏 着 错误 。 





除了 自己 生成 的 测试 用 例 之 外 ， 还 可 以 使 用 类 似 words .txt 这 样 的 
单词 表 来 测试 你 的 程序 。 通 过 扫 插 输出， 可 能 会 发 现 错误 ,但 请 注意 : 
你 可 能 发 现 一 种 类 型 的 错误 不 应 该 被 包含 但 却 被 包含 的 单词 ) ， 但 对 
Fy RAL MAN BEA OMA MEE, BARA KMAR) 。 


忆 之 ， 测 试 可 以 帮助 你 发 现 bug， 但 生成 一 组 好 的 测试 用 例 并 不 容 
易 。 而 且 ， 即 使 有 好 的 测试 用 例 ， 也 无 法 确定 程序 是 完全 正确 的 。 引 用 
个 传奇 计算 机 科学 家 的 话 : 








程序 测试 可 以 用 来 好 示 bug 的 存在 ， 但 无 法 显示 它们 的 缺 遍 ! 


(Program testing can be used to show the presence of bugs, but never to 


show their absence! ) 


—Edsger W.Dijkstra 


9.6 NEK 
文件 对 象 (file object) : 用 来 表示 一 个 打开 的 文件 的 值 。 


将 问题 回归 到 已 解决 问题 (reduction to a previously solved 
problem) : 通过 把 问题 表述 为 已 经 解决 的 某 个 问题 的 特例 解决 问题 的 
一 种 方式 。 





特殊 情形 (special case) : 一 种 不 典型 或 者 不 明显 (因此 更 可 能 没 
有 正确 处 理 ) 的 测试 用 例 。 


9.7 练习 


练习 9-7 





本 练习 中 的 问题 是 基于 广播 节目 《车 迷 天 下 》 (Car Talk) 中 出 现 
的 一 个 谜 题 而 设计 的 Chttp://www.cartalk.com/content/puzzlers ) : 


给 我 一 个 包含 3 组 连续 的 成 对 字母 的 单词 。 我 会 给 你 几 个 几乎 可 以 
达到 要 求 却 还 差 一 点 儿 的 词 作为 例子 。 例 如 ， 单 词 committee， 即 c-o-m- 
m-i-t-t-e-e。 除 了 i 不 满足 条 件 外 ， 这 个 单词 是 一 个 好 例子 。 或 者 
Mississippi: M-i-s-s-i- s-s-i-p-p-i。 如 果 你 能 够 拿 掉 其 中 的 1， 则 它 也 符合 
要 求 。 但 确实 有 这 么 一 个 单词 ， 并 且 束 我 所 知 ， 它 可 能 是 满足 这 个 条 件 
的 唯一 的 单词 。 当 然 也 可 能 存在 500 个 ， 但 我 只 能 想到 一 个 。 它 是 什么 
呢 ? 


编写 一 个 程序 来 找到 它 。 解 答 : 
http://thinkpython2.com/code/cartalk1.py. 
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下 面 是 另 一 个 《车 迷 天 下 》 中 的 谜 题 


Chttp://www.cartalk.com/content/puzzlers ) : 





“有 一 天 我 正在 高 速 公 路 上 开车 ， 碰 巧 注意 到 里 程 表 。 和 大 部 分 里 
程 表 一 样 ， 它 显示 6 位 整数 的 英里 数 。 所 以 ， 例 如 我 的 车 有 300 000 英 里 
里 程 ， 则 会 看 到 3-0-0-0-0-0。 





“那天 我 看 到 的 里 程 数 很 有 意思 。 我 及 现 最 后 4 位 数 是 回 文 的 ， 也 就 
是 说 ， 它 们 不 论 是 正 序 还 是 逆序 地 看 都 一 样 。 例 如 ，5-4-4-5 是 一 个 回 
文 ， 所 以 我 的 里 程 表 可 能 显示 为 3-1-5-4-4-5。 














“1 英里 之 后 ， 后 5 位 数组 成 一 个 回 文 。 例 如 ， 它 可 以 是 3-6-5-4-5-6。 
再 过 1 英里 ，6 位 数 的 中 间 4 位 是 一 个 回 文 。 而 接 下 来 ， 你 准备 好 了 吗 ? 
又 1 英里 过 去 ， 所 有 的 6 位 数 都 成 了 回 文 ! 


“问题 是 ， 我 第 一 次 看 里 程 表 时 ， 它 的 示 数 是 多 少 ? ” 


编写 一 个 Python 程序 ， 检 测 全 部 的 6 位 数 ， 并 打印 出 可 以 满足 上 面 
这 些 要 求 的 数字 。 解 答 : http://thinkpython2.com/code/cartalk2.py - 


练习 9-9 


下 面 是 为 一 个 《车 迷 天 下 》 的 谜 题 ， 你 可 以 使 用 一 个 搜索 来 解决 


Chttp://www.cartalk.com/ content/puzzlers ) : 


“最 近 我 去 母亲 家 时 ， 我 发 现 自 己 的 年 龄 的 两 位 数 正 好 是 母亲 的 年 
具 的 两 位 数 的 倒序 。 例 如 ， 如 有 果 她 是 73 妈 ， 我 是 37 妈 。 我 们 好 奇 这 种 事 
情 这 些 年 来 友 生 过 几 次 ， 但 很 快 我 们 的 话题 就 偏转 到 其 他 地 方 ， 所 以 没 
有 得 到 答案 。 





“我 回 家 后 ， 发 现 我 们 的 年 龄 互 为 倒序 的 事情 至 今 为 止 友 生 过 6 次 。 
我 还 发 现 ， 如 果 顺 利 的话 接 下 来 儿 年 还 会 再 遇 到 一 次 ， 并 且 在 那 之 后 如 
果 我 们 真 的 很 蔷 运 ， 还 能 再 遇 到 一 次 。 换 句 话 次 ， 它 总 共 可 能 发 生 8 
次 。 所 以 问题 是 ， 我 现在 年 龄 多 大 ? ” 





编写 一 个 Python 程序 ， 为 这 个 谜 题 搜 索 答 案 。 提 示 : 你 可 能 会 发 现 
字符 串 方法 zfill AA. 


解答 : http://thinkpython2.com/code/cartalk3.py。 





[1] 作者 在 上 一 段 话 中 模仿 了 Gadsby 的 风格 ， 不 使 用 字母 “e”， 所 以 说 话 
的 风格 很 怪 。 因 此 到 这 里 ， 他 就 说 “All right, PI stop now”， 意 思 是 停 
止 这 种 怪异 风格 的 描述 。 但 这 个 意思 无 法 在 译文 中 表达 。 上 一 段 话 的 瑞 


文 原文 是 : “In fact, it is difficult to construct a solitary thought without 





using that most common symbol. It is slow at first, but with caution and 


hours of training you can gradually gain facility. ”一 一 译 者 注 


第 10 草 ”列表 


本 章 介 绍 Python 语言 最 有 用 的 内 置 类 型 之 一 : 列表。 你 还 能 学 到 更 
多 关于 对 象 的 知识 ， 以 及 同一 个 对 象 有 两 个 或 更 多 变量 时 会 发 生 什 么 。 





10.1 列表 是 一 个 序列 


和 字符 串 相似 ， 列 表 dist) 是 值 的 序列 。 在 字符 串 中 ， 这 些 值 是 
字符 ;在 列表 中 ， 它 可 以 是 任何 类 型 。 列 表 中 的 值 称 为 元 素 
(element) ， 有 时 也 称 为 列表 项 Citem) 。 





创建 一 个 列表 有 好 几 种 方式 。 其 中 最 简单 的 方式 是 使 用 方 括号 《〈[ 
与 ] ) 将 元 素 括 起 来 。 


[10, 20, 30, 40] 
['crunchy frog', ‘ram bladder’, ‘lark vomit’ ] 


第 一 个 例子 是 4 个 整数 的 列表 。 第 二 个 例子 是 3 个 字符 串 的 列表 。 列 
表 中 的 元 素 并 不 一 定 非 得 是 同一 类 型 的 。 下 面 的 列表 包含 了 一 个 字符 
串 、 一 个 浮 后 数 、 一 个 整数 及 了 瞧 ! ) 另 一 个 列表 : 


['spam', 2.0, 5, [10, 20]] 


IRP EMIR EK ASIN = (nested) 。 





不 包含 任何 元 素 的 列表 称 为 空 列表 ， 可 以 使 用 空 方 括号 [] 来 创建 
空 列 表 。 


如 你 所 预料 的 ， 列 表 可 以 赋值 给 变量 : 





>>> cheeses = ['Cheddar', ‘Edam', 'Gouda'] 
>>> numbers = [42, 123] 


>>> empty = [] 
>>> print(cheeses, numbers, empty) 
['Cheddar', ‘Edam’, 'Gouda'] [42, 123] [] 





10.2 ”列表 是 可 变 的 


访问 列表 元 系 的 语法 和 访问 字符 串 中 字符 的 语法 是 一 样 的 一 一 使 用 
方 括 写 操作 符 。 方 括号 中 的 表达 式 指定 下 标 。 请 记得 下 标 是 从 0 开始 
的 ; 


>>> cheeses[@] 
"Cheddar' 


和 字符 串 不 同 的 是 ， 列 表 是 可 变 的 。 当 方 括号 操作 符 出 现在 赋值 语 
句 的 左 侧 时 ， 它 用 于 指定 列表 中 哪个 元 素 会 被 赋值 。 
>>> numbers = [42, 123] 


>>> numbers[1] = 5 
>>> numbers 


[42, 5] 





numbers 的 第 1 位 元 素 ， 原 先 的 值 是 123， 现 在 是 5 了 。 


图 10-1 显 示 了 cheeses 、numbers 和 empty 的 状态 图 。 


list 
cheeses — > 0 —> 'Cheddar' 
1 —> 'Edam' 


2 —> 'Gouda' 


numbers — > 





图 10-1 ”状态 图 








在 图 10-1 中 ， 外 面 写 有 list* 的 图 框 表示 列表 ， 里 面 显 示 的 是 列表 中 
的 元 素 。cheeses 变量 引用 者 一 个 列表 ， 包 含 3 个 元 素 ， 下 标 分 别 是 0、 
1 和 2。numbers 包含 两 个 元 素 ;， 本 图 显示 了 其 第 二 个 元 系 从 123 重 新 赋 
值 为 5 的 过 程 。empty 引用 一 个 没有 任何 元 素 的 空 列表 。 





列表 下 标 和 字符 串 下 标 工作 方式 相同 。 





o 任何 整 型 的 表达 式 都 可 以 用 作 下 标 。 
。 如 果 和 尝试 读 写 一 个 并 不 存在 的 元 素 ， 则 会 得 到 IndexError 。 
。 如 果 下 标 是 负数 ， 则 从 列表 的 结尾 处 反 过 来 数 下 标 访问 。 





in 操作 符 也 可 以 用 于 列表 。 


>>> cheeses = ['Cheddar', ‘Edam', "Gouda | 
>>> 'Edam' in cheeses 
True 


>>> 'Brie' in cheeses 
False 





10.3 通 历 一 个 列表 








避 历 一 个 列表 元 素 的 最 常见 方式 是 使 用 for 循环 。 语 法 和 字符 串 的 
ied yH TE]: 


for cheese in cheeses: 
print(cheese) 











在 只 需要 读 取 列表 的 元 素 本 身 时 ， 这 样 的 遍历 方式 很 好 。 但 如 果 需 
要 写 入 或 者 更 新 元 素 时 ， 则 需要 下 标 。 一 个 常见 的 方式 是 使 用 内 置 函 
数 range 和 len : 


for i in range(len(numbers) ): 
numbers[i] = numbers[i] * 2 


这 个 循环 遍历 列表 ， 并 更 新 每 个 元 素 。l1en 返回 列表 中 元 素 的 个 
aX. range 返回 一 个 下 标的 列表 ， 从 0 到 n -1， 其 中 n 是 列表 的 长 度 。 
次 迭代 时 ，i 获得 下 一 个 元 素 的 下 标 。 循 环 体 中 的 赋值 语句 使 用 i 来 读 
取 元 素 的 旧 值 并 赋值 为 新 值 。 











在 空 列表 上 使 用 for 循环 ， 则 循环 体 从 不 会 被 运行 : 


for x in []: 
print('This never happens." ) 


BAIR UER HERIR, RH TIRE — PS 
元 素 。 下 面 的 列表 长 度 是 4; 


['spam', 1, ['Brie', 'Roquefort', "Pol le Veq'], [1, 2, 3]] 





10.4 列表 操作 


+ 操作 符 可 以 拼接 列表 : 


a [1, 2, 3] 
b [4, 5, 6] 
C a+b 
C 
2 


3 3, 4, 5, 6] 





* 操 作 符 重复 一 个 列表 多 次 : 





第 一 个 例子 重复 列表 [8] 四 次 。 第 二 个 例子 重复 列表 [1，2，3] 三 


10.5 ”列表 切片 


切片 操作 符 也 可 以 用 于 列表 : 


>>> t = ['a', 'b' 
>>> t[1:3] 





如 果 省 略 掉 第 一 个 下 标 ， 则 切片 从 列表 开头 开始 。 如 果 省 略 掉 第 二 
个 下 标 ， 则 切片 至 列表 结尾 结束 。 如 果 两 个 下 标 都 省 略 ， 则 切片 就 是 整 
个 列表 的 副本 。 








因为 列表 是 可 变 的 ， 所 以 在 对 列表 进行 修改 操作 之 前 ， 复 制 一 份 是 
很 有 用 的 。 


如 果 切 片 操作 符 出 现在 赋值 语句 的 堪 侧 ， 则 可 以 更 新 多 个 元 素 : 


>>> t = ['a', 'b', 
>>> t[1:3] = p x' 
>>> t 


['a', "X's "y'; i ' 





10.6 ”列表 方法 


Python 为 列表 提供 了 不 少 操作 方法 。 例 如 ，append 可 以 在 列表 尾 
部 添加 新 的 元 素 : 


>>> t = ['a', 'b' 
>>> t. append ti d' ) 
>>> t 


['a', 'b', "C3 ' 





extend 方法 接收 一 个 列表 作为 参数 ， 并 将 其 所 有 的 元 素 附 加 到 列 
e 


>>> t1 = ['a', 'b' 
>>> t2 = ['d', 'e'] 
>>> t1.extend(t2) 
>>> t1 


pet o 





这 个 例子 中 t2 没有 被 修改 。 


sort 方法 将 列表 中 的 元 素 从 低 到 高 重新 排列 : 


>>> t = ['d', 'c' 
>>> t.sort() 
>>> t 


paa ti 





列表 的 大 多 数 方法 全 是 无 返回 值 的 。 它 们 修改 列表 ， 并 返回 None 


。 如 果 不 小 心 写 了 t = t.sort() ， 你 可 能 对 结果 感到 很 失望 。 


10.7 BRIN. WUE ANG fa 


OUR AE Re A A Os ER, AY DEAD TE YS: 


def add_all(t): 
total = 6 
for x int: 


total += x 
return total 





total 被 初始 化 为 0。 每 次 循环 中 ，x 获取 列表 中 的 一 个 元 素 。+= 
操作 符 为 更 新 变量 提供 了 一 个 简洁 的 方式 。 这 个 增加 赋值 语句 : 


等 价 于 : 


total = total + x 


随 着 循环 的 运行 ，total 会 累积 列表 中 的 值 的 和 ;这样 使 用 一 个 变 
量 有 时 称 为 累加 器 (accumulator) 。 


对 列表 元 素 累 加 是 如 此 常见 的 操作 ， 以 至 于 Python 提 供 了 一 个 内 置 
函数 sum : 
>>> t = [1, 2, 3] 


>>> sum(t) 
6 


pT 


类 似 这 样 ， 将 一 个 序列 的 元 素 值 合 起 来 到 一 个 单独 的 变量 的 操作 ， 
有 时 称 为 化 简 (reduce) 。 








有 时 候 你 想 要 在 过 历 一 个 列表 的 同时 构建 另 一 个 列表 。 例 如 ， 下 面 
的 函数 接收 一 个 字符 串 列 表 ， 并 返回 一 个 新 列表 ， 其 元 素 是 大 写 的 字符 
串 : 





def capitalize all(t): 
res = [] 
for s int: 


res.append(s.capitalize()) 
return res 





res 初始 化 为 一 个 空 列表 ; 每 次 循环 ， 我 们 给 它 附 加 一 个 元 素 。 所 
以 res 也 是 一 种 累加 器 。 


像 capitalize_all 这 样 的 操作 ， 有 时 被 称 为 映射 (map), HX 
它 将 一 个 函数 〈 在 这 个 例子 里 是 capitalize 方法 ) “映射 ?到 一 个 序列 
AES 70 Eo 


另 一 个 常见 的 操作 是 选择 列表 中 的 茶 些 元 素 ， 并 返回 一 个 子 列 表 。 
例如 ， 下 面 的 函数 接收 一 个 字符 串 列 表 ， 并 返回 那些 只 包含 大 写字 母 的 
字符 串 : 





def only_upper(t): 
res = [] 
for s int: 
if s.isupper(): 
res.append(s) 


return res 


isupper 是 一 个 字符 串 方法 ， 当 字符 串 中 只 包含 大 写字 母 时 返回 


True 。 


类 似 only_upper 这 样 的 操作 称 为 过 小 (filte) ， 因 为 它 选 择 列表 
中 的 东 些 元 素 ， 并 过 滤 邱 其 他 的 元 素 。 


列表 的 绝 大 多 数 闻 用 操作 都 可 以 用 映射 、 过 滤 和 化 简 的 组 合 来 表 
达 。 


10.8 HRILA 





从 列表 中 删除 元 素 ， 有 多 种 方法 。 如 果 知 道 元 素 的 下 标 ， 可 以 使 
用 pop : 


>>> t = ['a', "b"; ‘c'] 


>>> x = t.pop(1) 
>>> t 

['a', 'c'] 

>>> X 

'b' 





pop 修改 列表 ， 并 返回 被 删除 掉 的 值 。 如 果 不 提供 下 标 ， 它 会 删除 
并 返回 最 后 一 个 元 素 。 


如 果 不 需 要 使 用 删除 的 值 ， 可 以 使 用 del 操作 符 : 


>>> t = ['a', 'b' 
>>> del t[1] 
>>> t 


PT 








如 果 知 道 要 删除 的 元 素 《〈 而 不 是 下 标 ) ， 则 可 以 使 用 remove : 


>>> t = ['a', 'b', 'c'] 
>>> t. renave( b') 
>>> t 


re 





remove 方法 的 返回 值 是 None 。 





在 要 删除 多 个 元 素 ， 可 以 使 用 del 和 切片 下 标 : 


>>> t = ['a', 'b' 
>>> del t[1:5] 
>>> t 


pan eg 





和 通 第 一 样 ， 切 片 会 选择 所 有 的 元 素 ， 直 到 第 二 个 下 标 〈 并 不 包 


> 
WY 


10.9 ”列表 和 字符 串 





字符 串 是 字符 的 序列 ， 而 列表 是 值 的 序列 ， 但 字符 的 列表 和 字符 串 
并 不 相同 。 知 要 将 一 个 字符 串 转 换 为 一 个 字符 的 列表 ， 可 以 使 用 函 
list : 


>>> S = 'spam' 
>>> t = list(s) 
>>> t 


['s', 'p', 'a', 'm'] 





由 于 1ist 是 内 置 函 数 的 名 称 ， 所 以 应 当 尽 量 避 免 使 用 它 作为 变量 
名 称 。 我 也 避免 使 用 1 ， 因 为 它 看 起 来 太 像 数 字 1 了 。 因 而 我 使 用 t 。 


List 函数 会 将 字符 串 拆 成 单个 的 字母 。 如 果 想 要 将 字符 串 拆 成 单 
词 ， 可 以 使 用 split 方法 : 


>>> s = 'pining for the fjords' 
>>> t = s.split() 

>>> t 

['pining', ‘for', 'the', 'fjords'] 





split 还 接收 一 个 可 选 的 形 参 ， 称 为 分 隔 符 (delimiter) ， 用 于 指 
定 用 哪个 字符 来 分 隔 单 词 。 下 面 的 例子 中 使 用 连 字 符 (- ) 作为 分 陋 
和 从: 








>>> S = 'Spam-Sspam-spam' 
>>> delimiter = '-' 
>>> t = s.split(delimiter) 


>>> t 
['spam', 'spam', 'spam'] 





join split 的 逆 操 作 。 它 接收 字符 串 列表 ， 并 拼接 每 个 元 
Ro join 是 字符 串 的 方法 ， 所 以 必须 在 分 隅 符 上 调用 它 ， 并 传 入 列表 
作为 实 参 : 
>>> t = ['pining', ‘for', 'the', 'fjords'] 
>>> delimiter = ' ' 


>>> s = delimiter.join(t) 
>>> S 


"pining for the fjords’ 





在 这 个 例子 里 ， 分 隔 符 是 空格 ， 所 以 join 会 在 每 个 单词 之 间 放 一 
个 空格 。 知 想 不 用 空格 直接 连接 字符 串 ， 可 以 使 用 空 字符 串 ”' 作为 分 


Fy 


Katt o 





10.10 ”对 象 和 值 


如 采 我 们 运行 下 面 的 赋值 语句 : 


a = 'banana' 
b = 'banana' 


我 们 知道 a Mb 都 是 一 个 字符 串 的 引用 。 但 我 们 不 知道 它们 是 否 指 
问 同 一 个 字符 串 。 有 两 种 可 能 的 状态 ， 如 图 10-2 所 示 。 


a — > ’banana’ a 
> ’banana’ 
b — > ’banana Baer 
图 10-2 KAA 


一 种 可 能 是 ，a Mb 引用 着 不 同 的 对 象 ， 它 们 的 值 相同 。 男 一 种 情 
况 下 ， 它 们 指向 同一 个 对 象 。 








要 检查 两 个 变量 是 否 引 用 同一 个 对 象 ， 可 以 使 用 is 操作 符 


>>> a = 'banana' 
>>> b = 'banana' 
>>> a is b 


True 





在 这 个 例子 里 ，Python 只 建立 了 一 个 字符 串 对 象 ， 而 a 和 b 都 引用 


但 当 你 新 建 两 个 列表 时 ， 会 得 到 两 个 对 象 : 


>>> a = [1, 2, 3] 
>>> b = [1, 2, 3] 
>>> a is b 


False 





所 以 状态 图 如 图 10-3 所 示 。 


a —> [ 1,2,3] 
b — [1,2,3] 


图 10-3 KAA 





在 这 个 例子 里 我 们 会 说 这 两 个 列表 是 相等 的 〈equivalent) ， 因 为 
它们 有 相同 的 元 素 ， 但 它们 不 是 相同 的 《identical) ， 因 为 它们 并 不 是 
同一 个 对 象 。 如 果 两 个 对 象 相同 ， 则 必然 也 相等 ， 但 如 有 果 两 个 对 象 相 
等 ， 并 不 一 定 相 同 。 





到 目前 为 止 ， 我 们 都 不 加 区 分 地 使 用 “对 象 ? 和 “ 值 "， 但 更 精确 的 说 
法 是 对 象 有 一 个 值 。 如 果 求 值 [1,2,3] ， 会 得 到 一 个 列表 对 象 ， 它 的 值 
是 一 个 整数 的 序列 。 如 果 男 一 个 列表 包含 相同 的 元 系 ， 我 们 说 它 有 相同 
的 值 ， 但 它们 不 是 同一 个 对 象 。 


10.11 别名 


如 果 a 引用 一 个 对 象 ， 而 你 赋值 b = a ， 则 两 个 变量 都 会 引用 同一 
个 对 象 : 


>>> a = [1, 2, 3] 
>>> b=aa 
>>> bisa 


True 





这 里 的 状态 图 如 图 10-4 所 示 。 
en 
» > [1,2,3] 
图 10-4 KAA 


变量 和 对 象 之 间 的 关联 关系 称 为 引用 (reference) 。 在 这 个 例子 
里 ， 有 两 个 指向 同一 对 象 的 引用 。 








当 一 个 对 象 有 多 个 引用 ， 并 且 引 用 有 不 同 的 名 称 时 ， 我 们 说 这 个 对 
象 有 别名 Caliased) 。 





如 果 有 别名 的 对 象 是 可 变 的 ， 则 对 一 个 别名 的 修改 会 影响 男 一 个 : 


>>> b[6] = 42 
>>> a 
[42, 2, 3] 


[L E 
虽然 这 种 行为 可 能 很 和 有用， 但 它 也 容易 导致 错误 。 通 常 来 说 ， 当 处 
理 可 变 对 象 时 ， 避 免 使 用 别名 会 更 加 安全 。 
对 于 字符 串 这 样 的 不 可 变 对 象 ， 别 名 则 不 会 带 来 问题 。 在 下 面 的 例 
本 中 


a = 'banana' 
b = 'banana' 


Riga Mb 是 否 引用 同一 个 字符 种， 都 不 会 有 什么 区 别 。 


10.12 ”列表 参数 


当 你 将 一 个 列表 传递 给 函数 中 ， 函 数 会 得 到 列表 的 一 个 引用 。 如 果 
函数 中 修改 了 列表 ， 则 调用 者 也 会 看 到 这 个 修改 。 例 如 ，delete_head 
函数 删除 列表 中 的 第 一 个 元 素 : 


def delete _head(t): 
del t[6] 


下 面 使 用 它 : 


>>> letters = ['a', 'b', 'c' 


>>> delete eae (letters) 
>>> letters 
Pose] 





参数 t 和 变量 letters 是 同一 个 对 象 的 别名 。 栈 图 如 图 10-5 所 示 。 


因为 列表 被 两 个 帧 共 圣 ， 所 以 我 将 它 画 在 中 间 。 


delete_head 


图 10-5” 栈 图 





区 分 修改 列表 的 操作 和 新 建 列 表 的 操作 十 分 重要 。 例 如 ，append 
方法 修改 列表 ， 但 是 + 操作 符 新 建 一 个 列表 : 


>>> t1 = [1, 2] 
>>> t2 = t1.append(3) 





append 修改 列表 ， 返 回 None 。 


>>> t3 = tl + [4] 





操作 符 + 创 建 一 个 新 列表 ， 而 原始 的 列表 并 不 改变 。 


这 个 区 别 ， 在 编写 希望 修改 列表 的 函数 时 十 分 重要 。 例 如 ， 下 面 的 
函数 并 不 会 删除 列表 的 开头 : 
def bad_delete_head(t): 


t = t[1:] # 错 ! 


切片 操作 会 新 建 一 个 列表 ， 而 赋值 操作 会 让 tt 引用 指向 这 个 新 的 列 
表 ， 但 这 些 操作 对 调用 者 没有 影响 。 


>>> t4 = [1, 2, 3] 


>>> bad _delete_head(t4) 





fEbad_delete head 的 开头 ，t 和 t4 指向 同一 个 列表 。 在 函数 最 
后 ,，t 指向 了 一 个 新 的 列表 ， 但 t4 仍然 指向 原先 的 那个 没有 改变 的 列 





男 外 一 种 方法 是 编写 函数 创建 和 返回 一 个 新 的 列表 。 例 如 ，tail 
返回 除了 第 一 个 以 外 所 有 的 元 系 的 列表 : 


def tail(t): 
return 七 [1:] 


这 个 函数 不 会 修改 原始 列表 。 下 面 的 代码 展示 如 何 使 用 它 : 


>>> letters = ['a', 'b', ‘c'] 
>>> rest = ee (letters) 
>>> rest 


bt te] 





10.13 ”调试 


对 列表 〈 以 及 其 他 可 变 对 象 ) A AMA, H RER FEKE AE A ed 
试 。 下 面 介绍 一 些 常见 的 陷阱 ， 以 及 如 何 避 免 它们 。 


1. 大 部 分 列表 方法 都 是 修改 参数 并 返回 None 的 。 这 和 字符 串 的 方 
法 正 相 反 ， 字 符 串 方法 新 建 一 个 字符 串 ， 并 留 看 原始 的 字符 串 不 动 。 





如 果 你 习惯 于 写 下 面 这 样 的 字符 串 代 码 : 


word = word.strip() 


则 容易 倾 问 于 这 么 写 列表 代码 : 


t = t.sort() # 错 ! 


因为 sort 返回 None ， 接 下 来 对 t 进行 的 操作 很 可 能 会 失败 。 








在 使 用 列表 方法 和 操作 符 之 前 ， 应 当 仔细 阅读 文 要 ， 并 在 交互 模式 
中 测试 它们 。 


2. 选择 一 种 风格 ， 并 坚持 不 变 。 





列表 的 问题 之 一 是 同样 的 事情 有 太 多 种 可 用 的 做 法 。 例 如 ， 要 从 列 
表 中 删除 一 个 元 素 ， 可 以 使 用 pop 、remove 、del 或 者 甚至 是 切片 赋 
值 。 


要 添加 一 个 元 素 ， 可 以 使 用 append 方法 或 者 + 操作 符 。 假 设 t 是 一 
个 列表 ，x 是 一 个 列表 元 素 ， 下 面 的 操作 古 正确 的 : 





t.append(x) 


t= t + [x] 
t += [x] 





而 下 面 的 操作 是 错误 的 : 


ppend( [x]) 
t.append(x) 
x] 


.a 
+ [ 
= 七 + X 








在 交互 模式 中 试验 这 些 例子 ， 确 保 你 明白 它们 的 运行 细 市 。 注 意 只 
有 最 后 一 个 会 导致 运行 时 错误 ; 其 他 的 3 个 都 是 合法 的 ， 但 是 它们 的 结 
果 不 正确 。 





3. 通过 复制 来 避免 询 名 。 





如 末 想 要 使 用 类 似 sort 的 方法 来 修改 参数 ， 但 又 需要 保留 原先 的 
列表 ， 可 以 复制 一 个 副本 : 


t = [3, 1, 2] 
t2 = t[:] 
t2.sort() 

t 

1, 2] 


t2 
2, 3] 





在 这 个 例子 里 也 可 以 使 用 内 置 函 数 sorted ， 它 会 返回 一 个 新 的 排 
好 序 的 列表 ， 并 且 留 着 原先 的 列表 不 动 。 


>>> t2 = sorted(t) 
>>> 七 

[3, 1, 2] 

>>> t2 


[1, 2, 3] 





10.14 术语 表 


列表 dist) : 值 的 序列 。 


JCA (element) : 列表 (或 其 他 序列 中 的 一 个 值 ， 也 称 为 列表 
项 。 


RENAE (nested list) : 作为 其 他 列表 的 元 素 的 列表 。 


时 加 器 (accumulator) : 在 循环 中 用 于 加 和 或 者 累积 某 个 结果 的 变 


增加 赋值 Caugmented assignment) : 使 用 类 似 += 操 作 符 来 更 新 变 
量 值 的 语句 。 


化 简 (reduce) : 一 种 处 理 模式 ， 壳 历 一 个 序列 ， 并 将 元 素 的 值 宗 
积 起 来 计算 为 一 个 单独 的 结果 。 








We Cmap) : 一 种 处 理 模式 ， 过 历 一 个 序列 ， 对 每 个 元 素 进行 操 
YE 0 


WUE Cfilter) : PPLE, WAS, FRCP ET EAR PAR PY 
元 素 。 


对 象 Cobject) : 变量 可 以 引用 的 东西 。 对 象 有 类 型 和 值 。 


相等 〈equivalent) : 拥有 相同 的 值 。 


相同 Cidentical) : 是 同一 个 对 象 〈 并 且 也 意味 着 相等 ) 。 





引用 (reference) : 变量 和 它 的 值 之 间 的 关联 。 
别名 (aliasing) : 多 个 变量 同时 引用 一 个 对 象 的 情况 。 


分 隔 符 Cdelimiter) ， 用 于 分 隔 字符 串 的 一 个 字符 或 字符 串 。 


10.15 练习 


你 可 以 从 http://thinkpython2.com/code/list_exercises.py 下 载 这 些 练习 
的 解答 。 


练习 10-1 


编写 一 个 名 为 nested_sum 的 沙 数 ， 接 收 一 个 由 内 榜 的 整数 列表 组 
成 的 列表 作为 形 参 ， 并 将 内 髓 列表 中 的 值 全 部 加 起 来 。 例 如 : 


>>> t = [[1, 2], [3], [4, 5, 6]] 
>>> nested_sum(t) 
21 





2 >] 10-2 


编写 一 个 名 为 cumsum 的 函数 ， 接 收 一 个 数字 的 列表 ， 返 回 累 计 
Al; 也 就 是 说 ， 返 回 一 个 新 的 列表 ， 其 中 第 i 个 元 素 是 原先 列表 的 前 i +1 
个 元 素 的 和 。 例 如 : 





>>> t = [1, 2, 3] 
>>> cumsum(t) 
[1, 3, 6] 





2 >] 10-3 


编写 一 个 函数 middle ， 接 收 一 个 列表 作为 形 参 ， 并 返回 一 个 新 列 


表 ， 包 含 除 了 第 一 个 和 最 后 一 个 元 素 之 外 的 所 有 元 素 。 例 如 : 


>>> t = [1, 2, 3, 4] 
>>> middle(t) 


[2, 3] 





24 >] 10-4 


编写 一 个 名 为 chop 的 函数 ， 接 收 一 个 列表 ， 修 改 它 ， 删 除 它 的 第 
一 个 和 最 后 一 个 元 素 ， 并 返回 None 。 例 如 : 


>>> t = [1, 2, 3, 4] 
>>> chop(t) 





练习 10-5 


编写 一 个 名 为 js_sorted 的 函数 ， 接 收 一 个 列表 作为 形 参 ， 并 当 列 
表 是 按照 升序 排 好 序 的 时 候 返 回 True ， 人 否则 返回 False 。 


例如 : 


>>> is_sorted([1, 2, 2]) 
True 
>>> is_sorted(['b', 'a']) 


False 





2 >] 10-6 





两 个 单词 ， 如 果 重 新 排列 其 中 一 个 的 字母 可 以 得 到 另 一 个 ， 它 们 互 
为 回 文 (anagram) 。 编 写 一 个 名 为 is_anagram 的 函数 ， 接 收 两 个 字符 
串 ， 当 它们 互 为 回 文 时 返回 True 。 


练习 10-7 


编写 一 个 名 为 has_duplicates 的 函数 接收 一 个 列表 ， 当 其 中 任何 
一 个 元 素 出 现 多 于 一 次 时 返回 True 。 它 不 应 当 修 改 原始 列表 。 





练习 10-8 


这 个 练习 谈 的 是 所 谓 的 生日 迟 论 ， 你 可 以 在 
http://en.wikipedia.org/wiki/Birthday_paradox |i] ZA R Eo 


如 果 你 的 班级 中 有 23 个 学 生 ， 那 么 其 中 有 两 人 生日 相同 的 概率 有 多 
大 ? 你 可 以 通过 随机 生成 23 个 生日 的 样本 并 检查 是 否 有 相同 的 匹配 来 估 
计 这 个 概率 。 提 示 : 可 以 使 用 random 模块 中 的 randint 函数 来 生成 随 
机 生日 。 


你 可 以 从 http://thinkpython2.com/code/birthday.py 下 载 解答 。 


练习 10-9 





编写 一 个 函数 ， 读 取 文 件 words .txt ， 并 构建 一 个 列表 ， 每 个 元 素 
古 一 个 单词 。 给 这 个 函数 编写 两 个 版 本 ， 其 中 一 个 使 用 append 方法 ， 
男 一 个 使 用 t = 七 + [x] AIA. 哪 二 个 运行 时 间 更 长 ?为 什么 ? 


解答 : http://thinkpython2.com/code/wordlist.py。 


24 >| 10-10 


要 检查 一 个 单词 是 否 出 现在 单词 列表 中 ， 可 以 使 用 in 操作 符 ， 但 
由 于 它 需 要 按 顺 序 搜索 所 有 单词 ， 可 能 会 比较 慢 。 








因为 单词 是 按 字母 顺序 排列 的 ， 我 们 可 以 使 用 二 分 碍 找 《〈 也 叫 作 二 
分 搜索 ) 来 加 快速 度 。 二 分 查找 的 过 程 类 似 于 在 字典 中 奉 找 单词 。 从 中 
间 开 始 ， 检 碍 需要 找 的 单词 是 不 是 在 列表 中 间 出 现 的 单词 之 前 ， 如 果 
是 ， 则 继续 用 同样 的 方法 搜索 前 半 部 分 。 侍 则 搜索 后 半 部 分 。 








不 论 哪 种 情形 ， 都 将 搜索 空间 减 小 了 一 半 。 如 果 单 词 列表 有 
113,809 个 单词 ， 那 么 大 概 耗 费 17 步 束 能 找到 单词 ， 或 者 确认 它 不 在 列 
表 之 中 。 


编写 一 个 函数 ijn_bisect ， 接 收 一 个 排 好 序 的 列表 ， 以 及 一 个 目标 
值 ， 当 目标 值 在 列表 之 中 ， 返 回 其 下 标 ， 人 否则 返回 None 。 








或 者 你 可 以 阅读 bisect 模块 的 文档 ， 并 使 用 它 ! 
解答 : http://thinkpython.com2/code/inlist.py。 
练习 10-11 


两 个 单词 ， 如 果 其 中 一 个 是 为 一 个 的 反 向 序列 ， 则 称 它们 为 “反问 
对 ”编写 一 个 程序 找到 单词 表 中 出 现 的 全 部 反 同 对 。 


解答 : http://thinkpython2.com/code/reverse_pair.py。 


练习 10-12 


两 个 单词 ， 如 果 从 每 个 单词 中 交错 取出 一 个 字母 可 以 组 成 一 个 新 的 
单词 ， 我 们 称 它们 为 互 锁 ” Cinterlocking) 。 例 如 ,， “shoe” 和 “cold” 可 
以 互 锁 组 成 单词 “schooled”。 


解答 : http://thinkpython2.com/code/interlock.py. "Sit: 这 个 练习 局 
发 目 http:/puzzlers.org 的 一 个 示例 。 


1. 编写 一 个 程序 找到 所 有 互 锁 的 词 。 提 示 : 不 要 穷 举 所 有 的 词 
对 ! 

2， 能 不 能 找到 “三 互 锁 ”的 单词 ? 也 就 是 ， 从 第 一 、 第 二 或 者 第 三 
个 字母 开始 ， 每 第 三 个 字母 合 起 来 可 以 形成 一 个 单词 。 





ry 


第 11 音 ”字典 


介绍 另 一 种 内 置 类 型 : 字典 。 字 典 是 Python 最 好 的 语言 特性 之 
一 ， 它 是 很 多 高 效 而 优雅 的 算法 的 基本 构建 块 。 








11.1 字典 是 一 种 映射 





字典 类 似 于 列表 ， 但 更 加 通用 。 在 列表 中 ， 下 标 必须 是 整数 ， 而 
FEF HLA, Pts JLP) 可 以 是 任意 类 型 。 





字典 包含 下 标 〈 称 为 键 ) 集合 和 值 集 合 。 每 个 键 都 与 一 个 值 关 
联 。 键 和 值 之 间 的 关联 被 称 为 键 值 对 (key-value pair) ， 或 者 有 时 称 为 
一 项 (item) 。 


用 数学 语言 来 描述 ， 字 典 体 现 了 键 到 值 的 映射 ， 所 以 可 以 说 每 个 
键 “ 映 射 ? 到 一 个 值 。 作 为 示例 ， 我 们 构建 一 个 字典 ， 将 英语 单词 映射 到 
西班牙 语 上 ， 所 以 键 和 值 的 类 型 都 是 字符 串 。 


dict 新 建 一 个 不 包含 任何 项 的 字典 。 因 为 dict 是 内 置 函 数 的 
名 称 ， 应 当 避 免 使 用 它 作 为 变量 名 。 





>>> eng2sp = dict() 
>>> eng2sp 


{} 








这 里 花 括 号 {} 表示 一 个 空 的 字典 。 想 要 给 字典 添加 新 项 ， 可 以 使 
用 方 括号 操作 符 : 


>>> eng2sp['one'] = ‘uno' 


这 一 行 代 码 创 建 一 个 新 项 ， 将 键 'one' 映射 到 值 'uno' 上 。 如 果 我 


ue 


们 再 次 打印 这 个 字典 ， 可 以 看 到 一 个 键 值 对 ， FI 


al 


>>> eng2sp 
{'one': 'uno'} 


这 种 输出 格式 也 同样 是 输入 的 格式 。 例 如 ， 可 以 创建 一 个 包含 3 项 
的 新 字典 : 


', 'three': 'tres'} 


>>> eng2sp 
{'one': 'uno', 'three': 'tres', 'two': ' 





字典 中 键 值 对 的 顺 友 可 能 并 不 相同 。 如 果 你 在 自己 的 电脑 上 输入 相 
同 的 示例 ， 可 能 会 得 到 另 一 个 不 同 的 结果 。 总 之 ， 字 典 中 各 项 的 顺序 是 
不 可 预料 的 。 





但 这 并 不 是 问题 ， 因 为 字典 的 元 素 从 来 不 使 用 整数 下 标 进行 查找 。 
相对 地 ， 它 使 用 键 来 查找 对 应 的 值 : 


>>> eng2sp['two'] 
'dos' 


如 果 键 'two' 总 是 映射 到 值 'dos' 上 ， 那 么 各 项 的 顺序 其 实 并 不 重 





va 


如 果 一 个 键 并 不 在 字典 之 中 ， 会 得 到 一 个 异常 : 


>>> eng2sp['four' ] 
KeyError: 'four' 





len 函数 可 以 用 在 字典 上 ， 它 返回 键 值 对 的 数量 : 


>>> len(eng2sp) 
3 











in 操作 符 也 可 以 用 在 字典 上 ， 它 告诉 你 一 个 值 是 不 是 字典 中 的 键 
是 字典 中 的 值 则 不 算 ) 。 


>>> 'one' in eng2sp 
True 
>>> 'uno' in eng2sp 
False 








右 要 查看 一 个 值 是 不 是 出 现在 字典 的 值 中 ， 可 以 使 用 方法 values 
， 它 会 返回 一 个 值 集合 ， 并 可 以 应 用 in 操作 符 : 


>>> vals = eng2sp.values() 
>>> 'uno' in vals 


True 








in 操作 答对 列表 和 字典 使 用 不 同 的 算法 实现 。 对 于 列表 ， 它 按 顺 








序 搜索 列表 的 元 素 ， 如 8.6 节 所 示 。 当 列表 变 长 时 ， 搜 索 时 间 会 随 之 变 

而 对 于 字典 ，Python 使 用 一 个 称 为 散 列 表 (hashtable〉 的 算法 。 它 
有 一 个 值得 注意 的 特点 : 不 管 字典 中 有 多 少 项 ，in 操作 符 花 费 的 时 间 
都 差不多 。 我 会 在 21.4 节 中 解释 其 中 的 原因 ， 但 最 好 再 多 读 几 章 ， 这 样 
才 可 能 看 懂 解 释 的 内 容 。 














11.2 ”使 用 字典 作为 计数 器 集合 


假设 给 定 一 个 字符 串 ， 你 想 要 计算 每 个 字母 出 现 的 次 数 。 有 几 种 可 
能 的 实现 方法 ; 








1. 你 可 以 创建 26 个 变量 ， 每 个 变量 对 应 字母 表 上 的 一 个 字母 。 接 
独 遍 历 字符 串 ， 对 每 一 个 字符 ， 增 加 对 应 的 计数 希 。 你 可 能 需要 使 用 一 
个 链 式 条 件 判 断 。 





2. 你 可 以 创建 一 个 包含 26 个 元 系 的 列表 。 接 者 可 以 将 每 个 字符 转 
换 为 一 个 数字 使 用 内 置 函 数 ord ) ， 使 用 这 个 数字 作为 列表 的 下 标 ， 
并 增加 对 应 的 计数 器 。 


3. 你 可 以 建立 一 个 字典 ， 以 字符 作为 键 ， 以 计数 器 作为 相应 的 
值 。 第 一 次 轴 到 茶 个 字符 时 ， 在 字典 中 添加 对 应 的 项 。 之 后 可 以 增加 一 
个 已 经 存在 的 项 的 值 。 








这 几 种 方案 进行 相同 的 计算 ， 但 实现 计算 的 方式 不 一 样 。 


实现 (implementation〉 是 进行 某 种 计算 的 一 个 具体 方式 ; 有 的 实 
现 比 其 他 的 更 好 。 例 如 ， 字 典 实 现 的 优势 之 一 是 我 们 并 不 需要 预先 知道 
字符 串 中 可 能 出 现 哪些 字母 ， 因 而 只 需 为 真正 出 现 过 的 字母 分 配 空间 。 








下 面 是 这 个 实现 的 代码 : 





def histogram(s): 
d = dict() 
for c ins: 
if c not in d: 


d[c] =1 
else: 
d[c] t= 1 
return d 





这 个 函数 的 名 称 是 直方 图 Chistogram) ， 它 是 一 个 统计 学 术语 ， 
表示 一 个 计数 器 〈 或 者 说 频率 ) 的 集合 。 


函数 的 第 一 行 创建 一 个 空 的 字典 。for 循环 遍历 字符 串 。 每 次 欠 代 
中 ， 如 果 字 符 c 不 在 字典 中 ， 我 们 就 创建 一 个 新 项 ， 其 键 是 c ， 其 值 初 
始 化 为 1〈 因 为 我 们 已 经 见 到 这 个 字符 一 次 了 ) 。 如 果 c 已 经 在 字典 之 
中 ， 我 们 增加 d[c] 。 


下 面 是 这 个 函数 的 使 用 方式 : 


>>> h = histogram('brontosaurus ) 
>>> h 


{art Ty. “DS 





这 个 直方 图 显示 ， 字 母 'a' Al'b' 出 现 了 1 次 ; 'o' 出 现 了 两 次 ， 依 
此 类 推 。 


字典 有 一 个 方法 get ， 接 收 一 个 键 以 及 一 个 默认 值 。 如 采 键 出 现在 
字典 中 ，get 返回 对 应 的 值 ， 人 否则 它 返 回 默 认 值 。 例 如 : 





>>> h = histogram(‘a' ) 
>>> h 

{'a': 1} 

>>> h.get('a', @) 

1 

>>> h.get('b', @) 


| 
作为 练习 ， 使 用 get 将 histogram 写 得 更 紧凑 一 些 。 你 应 当 可 以 消 
除 掉 if 语句 。 


11.3 ”循环 和 字典 


如 宁 在 for 循环 中 使 用 字典 ， 会 过 历 字 典 的 键 。 例 
如 ，print_hist 函数 打印 字典 的 每 一 个 键 以 及 对 应 的 值 : 


def print_hist(h): 
for c inh: 


print(c, h[c]) 





下 面 是 这 个 函数 输出 的 样子 : 


>>> h = histogram('parrot') 
>>> print_hist(h) 

a 1 

p 1 
r2 
t 1 
o 1 





REI, BEAN HEMRA Ree I. EII EA E, BY DAE 
用 内 置 函 数 sorted : 


>>> for key in sorted(h) 
print(key, h[key]) 





11.4 反问 查找 





给 定 一 个 字典 d 和 键 k ， 找 到 对 应 的 值 v = dik] 非常 容易 。 这 个 
操作 称 为 查找 〈lookup) 。 


但 是 如 果 有 v ， 而 想 找 到 k 时 怎么 办 ? 这 里 有 两 个 问题 : 首先 ， 可 
能 存在 多 个 键 映 射 到 同一 个 值 v 上 。 随 不 同 的 应 用 场景 ， 也 许可 以 挑 其 
中 一 个 ， 或 者 也 许 需要 建立 一 个 列表 来 保存 所 有 的 键 。 其 次 ， 并 没有 可 
以 进行 反 向 查找 的 简单 语法 ， 你 需要 使 用 搜索 。 





下 面 是 一 个 函数 ， 接 收 一 个 值 ， 并 返回 映射 到 该 值 的 第 一 个 键 : 


def reverse_lookup(d, v): 
for k in d: 
if d[k] == v: 
return k 


raise LookupError() 





这 个 函数 是 搜索 模式 的 又 一 个 示例 。 但 它 使 用 了 一 个 我 们 还 没 见 过 
的 语言 特性 ，raise 语句 。 raise 语句 会 生成 一 个 异常 ， 在 这 个 例子 


里 它 生 成 一 个 LookupError ， 这 是 一 个 内 置 异常 ， 通 常用 来 表示 查找 
操作 失败 。 








如 果 我 们 到 达 了 循环 的 结尾 ， 就 意味 着 v 在 字典 中 没有 作为 值 出 现 
过 ， 所 以 我 们 抛 出 一 个 异常。 





下 面 的 例子 展示 了 一 个 成 功 的 反 疝 查找: 


histogram('parrot') 
reverse _lookup(h, 2) 





以 及 一 个 不 成 功 的 反问 查找 : 


>>> k = reverse lookup(h, 3) 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

File "<stdin>", line 5, in reverse lookup 
LookupError 





当 你 自己 抛 出 异常 时 ， 效 果 和 Python 抛 出 异常 是 一 样 的 : 它 会 打印 
出 一 个 回调 和 一 个 错误 信息 。 


raise 语句 也 可 以 接收 一 个 可 选 的 参数 用 来 详细 描述 错误 。 例 如 : 


>>> raise LookupError('value does not appear in the dictionary ) 
Traceback (most recent call last): 
File "<stdin>", line 1, in ? 


LookupError: value does not appear in the dictionary 
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时 ， 会 对 程序 的 性 能 有 很 大 影响 。 


11.5 字典 和 列表 


列表 可 以 在 字典 中 以 值 的 形式 出 现 。 例 如 ， 如 果 你 过 到 一 个 将 字母 
映射 到 频率 的 字典 ， 可 能 会 想 要 反 转 它 ;， 也 就 是 说 ， 建 立 一 个 字典 ， 将 
频率 映射 到 字母 上 。 因 为 可 能 出 现 多 个 字母 频率 相同 的 情况 ， 在 反 转 的 
字典 中 ， 每 项 的 值 应 当 是 字母 的 列表 。 


这 里 是 一 个 反 转 字典 的 函数 : 


def invert dict(d): 
inverse = dict() 
for key in d: 
val = d[key] 
if val not in inverse: 


inverse[val] = [key] 
else: 
inverse[val].append(key) 
return inverse 





每 次 循环 中 ，key Md 中 获得 一 个 键 ， 而 val 获得 相应 的 值 。 ae 
val 不 在 inverse 字典 中 ， 意 味 着 我 们 还 没有 见 到 过 它 ， 所 以 新 建 一 

， 并 将 它 初 始 化 为 一 个 单 件 (singleton， 即 只 包含 一 个 元 素 的 列 
a 否则 我 们 已 经 见 过 这 个 值 了 ， 因 此 将 相应 的 键 附加 到 列表 末尾 。 





下 面 是 一 个 示例 : 





>>> hist = histogram('parrot') 

>>> hist 

Canl “ps Ls “elt 23 "te 1, “ots 1} 
>>> inverse = invert_dict(hist) 

>>> inverse 

{1: ['a', 'p', ‘t', ‘o'], 2: ['r']} 


pO 


图 11-1 是 显示 hist 和 inverse 的 状态 图 。 字典 使 用 一 个 上 方 标 
明 dict 的 图 框 表 示 ， 内 部 包含 键 值 对 。 如 果 值 是 整数 、 浮 点 数 或 字符 
串 ， 我 会 把 它们 画 到 图 框 内 ， 但 我 常常 会 将 列表 画 在 图 框 之 外 ， 以 便 保 
持 状 态 图 的 简洁 。 


dict dict 


list 


inv 








图 11-1 ”状态 图 


如 本 例 所 示 ， 列 表 可 以 用 作 字 典 的 值 ， 但 它们 不 能 用 作 键 。 如 条 答 
试 的 话 ， 会 得 到 如 下 的 结果 : 


>>> t = [1, 2, 3] 

>>> d = dict() 

>>> d[t] = ‘oops’ 

Traceback (most recent call last): 


File "<stdin>", line 1, in ? 
TypeError: list objects are unhashable 





之 前 我 提 到 过 字典 是 通过 散 列 表 的 方式 实现 的 ， 这 意味 着 键 必须 是 


可 散 列 Chashable) 的 。 


散 列 是 一 个 函数 ， 接 收 “〈 任 意 类 型 ) 的 值 并 返回 一 个 整数 。 字 典 
使 用 这 些 被 称 为 散 列 值 的 整数 来 保存 和 碍 找 键 值 对 。 


这 和 套 系 统 当 键 不 可 变 时 ， 可 以 正确 工作 。 但 如 果 像 列表 这 样 ， 键 是 
可 变 的 话 ， 则 会 有 不 好 的 事情 发 生 。 例 如 ， 新 建 一 个 键 值 对 时 ，Python 
将 键 进 行 散 列 并 存储 到 对 应 的 地 方 。 如 果 修 改 了 键 并 再 次 散 列 ， 它 会 指 
问 一 个 不 同 的 地 方 。 在 那 种 情况 下 ， 会 导致 同一 个 键 有 两 个 条 目 ， 或 者 
可 能 找 不 到 某 个 键 。 不 论 如 何 ， 字 典 将 无 法 正确 工作 。 


因此 键 必须 是 可 散 列 的 ， 而 类 似 列表 这 样 的 可 变 类 型 是 不 可 散 列 
的 。 绕 过 这 种 限制 的 最 简单 办 法 是 使 用 元 组 ， 下 一 半 会 有 详细 介绍 。 


因为 字典 是 可 变 的 ， 它 也 不 能 用 作 键 ， 但 它 可 以 用 作 字 典 的 值 。 


11.6 is 


如 果 你 尝试 过 6.7 节 中 的 fibonacci 函数 ， 可 能 会 注意 到 ， 提 供 的 
参数 越 大 ， 函 数 运行 的 时 间 越 长 ， 并 且 运 行 时 间 增 长 很 快 。 


Y 


为 了 明白 为 什么 会 这 样 ， 考 虑 图 11-2， 它 展示 了 fibonocci K 
数 n=4 时 的 调用 图 。 


调用 图 显示 了 一 组 函数 帧 ， 并 用 箭头 将 函数 的 帧 和 它 调 用 的 函数 帧 
连接 起 来 。 在 图 的 顶端 ，n=4 的 fibonacci 调用 了 n=3 和 n=2 的 
fibonacci 。 同 样 地 ，n=3 的 位 bonacci 调用 了 n=2 和 n=1 的 
fibonacci 。 依 此 类 推 。 


数 一 下 fibonacci(6) 和 fibonacci(1) 被 调用 了 多 少 次 。 这 是 本 
问题 的 一 个 很 低 效 的 解雇 方案， 而且 当 参数 变 大 时 ， 事 情 会 变 得 更 粳 。 





一 个 解决 办 法 是 记录 已 经 计算 过 的 值 ， 并 将 它们 保存 在 一 个 字典 
中 。 将 之 前 计算 的 值 保存 起 来 以 便 后 面 使 用 的 方法 称 为 备 访 
(memo) 。 下 和 面 是 一 个 使 用 了 备 态 的 fibonacci 版 本 : 


known = {0:0, 1:1} 


def fibonacci(n): 
if n in known: 
return known[n ] 


res = fibonacci(n-1) + fibonacci(n-2) 
known[n] = res 
return res 








fibonacci 


n— > 4 










fibonacci 
n —>= 2 
fibonacci fibonacci 
n —> 1 n 一 = 0 


fibonacci 
n —>= 3 
fibonacci fibonacci 
n —>= 2 n —> 1 
fibonacci fibonacci 
n 一 = 1 n 一 = 0 


known 是 一 个 用 来 记录 我 们 已 知 的 Fibonacci 数 的 字典 。 开 始 时 它 有 
两 项 : 0 映射 到 0， 以 及 1 映射 到 1。 












图 11-2 调用 图 








每 当 fibonacci 被 调用 时 ， 它 会 先 检查 known 。 如 果 结 果 已 经 存 
在 ， 则 可 以 立即 返回 。 如 果 不 存 在 ， 它 需要 计算 这 个 新 值 ， 将 其 添加 进 
字典 ， 并 返回 。 


如 末 你 运行 fibonacci 的 这 个 版 本 ， 并 将 其 与 原始 版 本 进行 比较 ， 你 
会 发 现 ， 这 个 版 本 快 得 多 。 


11.7 全 局 变量 


在 前 一 个 例子 中 ，known 是 在 函数 之 外 创建 的 ， 所 以 它 属 于 被 称 
为 main _ ”的 特殊 帧 。_main_ _ 之 中 的 变量 有 时 被 称 为 全 局 变量 ， 
因为 它们 可 以 在 任意 函数 中 访问 。 和 局 部 变量 在 函数 结束 时 就 消失 不 
同 ， 全 局 变量 可 以 在 不 同 函 数 的 调用 之 间 持 和 久 存 在 。 








全 局 变量 常常 用 作 标 志 (flag) ; 它 是 一 种 布尔 变量 ， 可 以 标志 一 
个 条 件 是 否 为 真 。 例 如 ， 有 的 函数 使 用 一 个 叫 verbose 的 标志 来 控制 输 
出 的 详细 程度 : 





verbose = True 


def example1(): 


if verbose: 
print('Running example1' ) 











如 采 你 和 尝试 给 全 局 变量 重新 赋值 ， 会 感到 尺 讶 。 下 面 例子 的 本 
re AO PR BE a Bed A 





Ells 
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been_called = False 


def example2(): 


been_called = True 





但 当 你 运行 它 时 ， 会 发 现 been_called 的 值 并 不 会 变化 。 问 题 在 
于 函数 example2 会 新 建 一 个 局 部 变量 been_called 。 局 部 变量 在 函数 








结束 时 就 会 消失 ， 并 且 对 全 局 变量 没有 任何 影 啊 。 


要 想 在 函数 中 给 全 局 变量 重新 赋值 ， 你 需要 在 使 用 它 之 前 先 声明 
量 ; 


been_called = False 


def example2(): 
global been_called 
been_called = True 





global 语句 告诉 编译 器 , “在 这 个 函数 里 ， 当 我 说 been_called 
时 ， 我 指 的 是 全 局 变量 ;不 要 新 建 一 个 局 部 变量 。” 





下 面 是 一 个 尝试 更 新 全 局 变量 的 例子 : 


count = @ 


def example3(): 
count = count + 1 


UnboundLocalError: local variable 'count' referenced before assignment 





Python 会 假设 count 是 局 部 的 ， 在 这 种 假设 下 你 在 写 入 它 之 前 先 读 
取 了 。 和 解决 方案 也 是 声明 count 为 全 局 变量 。 


def example3(): 
global count 


count += 1 


如 果 全 局 变量 指向 的 是 可 变 的 值 ， 可 以 不 用 声明 该 变量 就 可 以 修改 
该 值 : 














known = {0:0, 1:1} 


def example4(): 


known[2] = 1 
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果 想 要 给 全 局 变量 重新 赋值 ， 则 需要 声明 它 : 





def example5(): 
global known 


known = dict() 








全 局 变量 很 有 8 用， 但 是 如 果 使 用 太 多 ， 并 且 频 繁 修改 ， 可 能 会 让 代 
码 比 较 难 调试 。 





11.8 ”调试 


在 使 用 更 大 的 数据 集 时 ， 通 过 打印 和 手动 检查 输出 的 方式 来 调试 已 
经 变 得 很 茶 拙 了。 下面 是 一 些 调 试 大 数据 集 的 建议 。 


缩小 输入 
如 果 可 能 ， 减 小 数据 集 的 尺寸 。 例 如 ， 程 序 如 果 读 入 文本 文件 ， 可 


以 从 开头 10 行 开始 ， 或 者 使 用 你 能 找到 的 最 小 样本 。 你 可 以 编辑 文件 本 
F, 或 者 (更 好 地 ) 修改 程序 让 它 只 读 入 前 n 行 。 





如 果 出 现 了 错误 ， 可 以 调 小 n ， 小 到 足够 展现 出 错误 的 最 小 程度 ， 
并 在 修改 之 后 逐渐 增 大 n 。 


仿 查 概要 信息 和 类 型 


与 其 打印 和 检查 整个 数据 集 ， 可 以 考虑 打印 出 数据 的 概要 信息 例 
如 ， 字 典 中 条 目的 数量 ， 或 者 一 个 列表 中 数 的 和 。 








运行 时 错误 的 一 个 种 见 原因 是 某 个 值 的 类 型 不 对 。 调 试 这 种 错误 
j He 


I, a YA ti BET) CV SS ee T 
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有 时 候 可 以 写 代码 自动 检查 错误 。 例 如 ， 如 果 你 要 计算 一 系列 数 的 


平均 值 ， 可 以 检查 结果 是 否 比 列表 中 最 大 的 数 小 ， 或 者 比 最 小 的 数 大 。 
这 种 检查 称 为 “健全 检查 ”(sanity check) ， 因 为 它 会 发 现 那 些 “ 发 疯 ” 的 


E 
结 


男 一 种 检查 可 以 对 比 两 种 不 同 的 计算 的 结果 ， 查 看 它们 是 否 一 致 。 
这 样 的 检查 称 为 “一 致 性 检查 ”。 


格式 化 输出 





格式 化 调试 输出 ， 可 以 更 容易 发 现 错误 。 我 们 在 6.9 节 中 己 经 看 到 
过 一 个 例子 。pprint 模块 提供 了 一 个 pprint 函数 ， 可 以 将 内 置 类 型 的 
值 以 更 加 入 性 化 的 可 读 的 格式 打印 出 来 。 (pprint 代表 “pretty 


print”. ) 


为 外 ， 再 提醒 一 次 ， 花 费时 间 构 建 脚手架 代码 ， 可 以 减少 未 来 进行 
调试 的 时 间 。 


11.9 ÑEK 





映射 (mapping) : 一 个 集合 中 的 每 个 元 素 与 男 一 个 集合 中 的 元 素 
所 产生 的 关联 。 


字典 (dictionary) : 从 键 到 对 应 的 值 的 映射 。 
键 值 对 (key-value pair) : 键 到 值 的 映射 的 展示 。 


项 (item) : 在 字典 中 ， 键 值 对 的 另 一 个 名 称 。 








键 〈key) : 字典 中 出 现在 键 值 对 的 前 一 部 分 的 对 象 。 


值 (value) : 字典 中 出 现在 键 值 对 的 后 一 部 分 的 对 象 。 这 上 比 我 们 
之 前 提 到 的 “ 值 ?更 加 具体 。 


实现 Cimplementation) : 进行 计算 的 一 个 具体 方式 。 


散 列 表 (hashtable〉: Python 字典 的 实现 用 的 算法 。 





散 列 函数 (hash function) : 散 列 表 中 用 来 计算 一 个 键 的 位 置 的 函 
BL 


可 散 列 Chashable) : 拥有 散 列 函数 的 类 型 。 不 可 变 类 型 ， 诸 如 整 
数 、 浮 点 数 和 字符 串 都 是 可 散 列 的 ， 可 变 类 型 ， 诸 如 列表 和 字典 ， 都 是 
不 可 散 列 的 。 


查找 Cookup) : 字典 的 一 个 操作 ， 接 收 一 个 键 ， 并 找到 它 对 应 的 


{Ei 


反问 查找 (reverse lookup) : 字典 的 一 个 操作 ， 通 过 一 个 值 来 找到 
它 对 应 的 一 个 或 多 个 键 。 


raise 语句 (raise statement) : 一 个 (故意 ) 抛 出 异常 的 语句 。 


单 件 (singleton) : 只 包含 一 个 元 素 的 列表 (或 其 他 序列 )。 








调用 图 (call graph) : 一 个 用 来 展示 程序 运行 中 创建 的 每 一 帧 的 
关系 的 岁 。 使 用 箭头 连接 每 个 调用 者 和 被 调用 者 。 


fis (memo) : 将 计算 的 结果 存储 起 来 ， 以 避免 将 来 进行 不 必要 
的 计算 。 


全 局 变量 (global variable) : 在 函数 之 外 定义 的 变量 。 全 局 变量 
可 以 在 任何 函数 中 访问 。 





全 局 语句 (global statement) : 声明 变量 名 为 全 局 的 语句 。 





标志 Clag): 用 于 标志 一 个 条 件 是 否 为 真 的 布尔 变量 。 


声明 (declaration) : 类 似 于 global 这 样 的 用 于 通知 解释 器 关于 
一 个 变量 的 信息 的 语句 。 


11.10 练习 


练习 11-1 


编写 一 个 函数 ， 读 入 words .txt 中 的 单词 ， 并 将 其 作为 键 保 存 到 一 
个 字典 中 。 字 典 的 值 是 什么 并 不 重要 。 然 后 你 就 可 以 使 用 in 操作 符 快 
速 检查 一 个 字符 串 是 人 否 在 这 个 字典 中 。 





如 果 你 做 过 了 练习 10-10， 可 以 将 这 个 实现 与 列表 的 in 操作 符 以 及 
二 分 查找 进行 速度 的 对 比 。 


练习 11-2 


阅读 字典 方法 setdefault 的 文档 ， 并 使 用 它 来 写 一 个 更 简洁 的 


invert_dict 。 


2K 6-2 F Ackermann K EAR SILA, JPEG ABZ 
后 是 个 能 让 它 运 行 更 大 的 参数 。 提 示 : 不 能 。 


解答 : http://thinkpython2.com/code/ackermann_memo.py. 
练习 11-4 


如 果 你 做 过 练习 10-7， 则 已 经 有 一 个 接受 了 列表 作为 形 参 的 函 





数 has_duplicates ， 当 列表 中 有 任意 元 素 出 现 多 于 1 次 时 返回 True 。 
使 用 字典 编写 一 个 更 快 、 更 人 简单 的 has_duplicates 。 
解答 : http://thinkpython2.com/code/has_duplicates.py。 
练习 11-5 


两 个 单词 ， 如 果 可 以 使 用 轮转 操作 将 一 个 转换 为 另 一 个 ， 则 称 
为 “轮转 对 ”( 参 见 练习 8-5 中 的 rotate_word mA) 。 


编写 一 个 程序 ， 读 入 一 个 单词 表 ， 并 找到 所 有 的 轮转 对 。 
解答 : http://thinkpython2.com/code/rotate_pairs.py。 
练习 11-6 


下 面 是 《车 迷 天 下 》 节 目 中 的 另 一 个 谜 题 


Chttp://www.cartalk.com/content/ puzzlers) : 


这 个 谜 题 是 一 个 叫 Dan OLeary 的 伙计 寄 过 来 的 。 他 曾经 过 到 一 个 
单 首 节 、5 字 母 的 第 用 单词 ， 有 如 下 所 述 的 特殊 属性 。 当 你 删除 第 一 个 
字母 时 ， 剩 下 的 字母 组 成 原单 词 的 一 个 同音 词 ， 即 发 音 完 全 相同 的 词 。 
将 第 一 个 字母 放 回 去 ， 并 删除 第 二 个 字母 ， 结 果 也 是 原单 词 另 一 个 同音 
词 。 问 题 是 ， 这 个 单词 是 什么 ? 





接 下 来 我 给 你 一 个 示例 ， 但 它 并 不 能 完全 符合 条 件 。 我 们 看 这 个 5 
字母 单词 “wrack ”，W-R-A-C-K， 也 就 是 “wrack with pain” ERIE 
”) 里 的 那个 词 。 如 果 我 删 掉 第 一 个 字母 ， 会 剩 下 一 个 4 字母 的 单词 ， 


“R-A-C-K”. Eti, “Holy cow, did you see the rack on that buck! It 
must have a nine-pointer!” (CRE! (RA BI) AS VU EE A RE Aa SS! 一 定 有 
9 个 特 角 ! ”) 中 的 那个 词 。 它 是 一 个 完美 的 同音 词 。 但 如 果 你 把 “w”" 放 
回去 ， 并 删 掉 “r+”， 会 得 到 单词 “wack”， 也 是 一 个 真实 单词 ， 但 它 读音 
和 其 他 两 个 不 一 样 。 


但 就 Dan 和 我 所 知 ， 至 少 有 一 个 单词 能 够 通过 删除 前 两 个 字母 得 到 


两 个 同音 词 。 问 题 是 ， 这 个 单词 是 什么 ? 





你 可 以 使 用 练习 11-1 中 的 字典 来 检测 一 个 字符 串 是 否 出 现在 单词 表 
中 。 








要 检查 两 个 单词 是 不 是 同音 词 ， 可 以 使 用 CMU 发 音 词 典 。 你 可 以 
从 http://www.speech.cs.cmu.edu/ cgi-bin/cmudict 或 者 
http://thinkpython2.com/ code/c06d 下 载 它 ， 也 可 以 下 载 
http://thinkpython2.com/code/pronounce.py， 其 中 提供 了 一 个 叫 
作 read_dictionary 的 函数 来 读 入 发 音 词典 并 返回 一 个 Python 字典 ， 
将 每 个 单词 映射 到 表示 其 主要 读音 的 字符 串 上 。 





编写 一 个 程序 ， 列 出 所 有 可 以 解答 这 个 谜 题 的 单词 。 


解答 : http://thinkpython2.com/code/homophone.py. 


第 12 章 ”元 组 





本 章 介 绍 尺 外 一 种 内 置 类 型 一 一 元 组 ， 并 展示 列表 、 字 典 和 元 组 三 
者 如 何 一 起 工作 。 我 还 会 介绍 一 种 很 有 用 的 可 变 长 参数 列表 功能 : 收集 
操作 符 和 分 散 操作 符 。 


请 注意 : 元 组 〈tuple) 这 个 词 的 读音 并 没有 统一 标准 。 有 些 人 会 读 
成 *tuh-ple”， 与 “supple" 同 音 ， 但 在 程序 设计 界 ， 大 多 数 人 都 恋 作 “too- 
ple”， 与 “quadruple” 同 首 。 








12.1 元 组 是 不 可 变 的 


元 组 是 值 的 一 个 序列 。 其 中 的 值 可 以 是 任何 类 型 ， 并 且 按 照 整 数 下 
标 索 引 ， 所 以 从 这 方面 看 ， 元 组 和 列表 很 像 。 元 组 和 列表 之 间 的 重要 区 
别 是 ， 元 组 是 不 可 变 的 。 














语法 上 ， 元 组 就 是 用 逗号 分 隔 的 一 列 值 





若 要 新 建 只 包含 一 个 元 素 的 元 组 ， 需 要 在 后 面 添加 一 个 逗号 ; 


>>> t1 = ‘a’, 
>>> type(t1) 
<class ‘'tuple'> 





而 用 括号 括 起 来 的 单独 的 值 并 不 是 元 组 : 


>>> t2 = ('a') 
>>> type(t2) 


<class 'str'> 





BE UAL AP ce AA eR tuple. AABN, Ee 
新 建 一 个 空 元 组 : 


>>> t = tuple() 
>>> t 


() 





如 果 参 数 是 一 个 序列 (字符 串 、 列 表 或 者 元 组 )， 结 果 就 是 一 个 包 
含 友 列 的 元 素 的 元 组 : 
>>> t = tuple('lupins') 


>> t 
(E 'u', "ps zi 








因为 tuple Ay Bee Ben 4 on, Hr A E SL E30 EA BR o 


大 多 数列 表 操 作 也 可 以 用 于 元 组 。 方 括号 操作 符 可 以 用 下 标 取得 元 





而 切片 操作 符 选 择 一 个 范围 内 的 元 素 : 


>>> t[1:3] 
(bt!) 


但 如 末 尝 试 修改 元 组 中 的 一 个 元 素 ， 会 得 到 错误 : 


>>> 七 [6] = 
TypeError: object doesn't support item assignment 











由 于 元 组 是 不 可 变 的 ， 所 以 不 能 修改 它 的 元 素 。 但 是 可 以 将 一 个 元 
HERNIA T: 





这 条 语句 生成 新 元 组 ， 然 后 使 t 引用 它 。 


天 系 运算 符 适 用 于 元 组 和 其 他 序列 。Python 从 比较 每 个 序列 的 第 一 
PICA ER. WRENS, ERA RT oom, KRR, A 
到 它 找 到 不 同 元 素 为 止 。 子 厅 列 元 系 不 在 考虑 之 列 ( 尽 管 它们 实际 上 很 
K) 


>>> (0, 1, 2) < (@, 3, 4) 
True 
>>> (©, 1, 2000000) < (Ə, 3, 4) 


True 





12.2 元 组 赋值 


交换 两 个 变量 的 值 常 常 很 有 用 。 使 用 传统 的 赋值 方式 ， 需 要 使 用 一 
个 临时 变量 。 例 如 ， 要 交换 a 和 b : 


>>> temp =a 
>>> a=b 


>>> b = temp 





PRT RAT, MC ZEYH: 


>>> a, b=b, a 


左边 是 一 个 变量 的 元 组 ， 右 边 是 表达 式 的 元 组 。 每 个 值 会 被 赋值 给 
相应 的 变量 。 右 边 所 有 的 表达 式 ， 都 会 在 任何 赋值 操作 进行 之 前 完成 求 
值 。 





左边 变量 的 个 数 和 右边 值 的 个 数 必 须 相同 : 


>>> a, b= 1, 2, 3 
ValueError: too many values to unpack 


更 通用 地 ， 右 边 可 以 是 任意 类 型 的 序列 《字符 串 、 列 表 或 元 组 ) 。 
例如 ， 想 要 将 电子 邮件 地 址 拆 分 成 用 户 名 和 域名 ， 可 以 这 么 写 : 








>>> addr = 'monty@python.org' 
>>> uname, domain = addr.split('@') 


pt 


split 返回 两 个 元 素 的 列表 ; 第 一 个 元 素 被 赋值 到 uname ， 第 二 个 
到 domain 上 。 
>>> Uname 


"monty ' 
>>> domain 


"python.org' 





12.3 ”作为 返回 值 的 元 组 


严格 地 说 ， 函 数 只 能 返回 一 个 值 ， 但 如 果 返 回 值 是 元 组 的 话 ， 效 果 
和 返回 多 个 值 差不多 。 例 如 ， 如 宁 将 两 个 整数 相 除 ， 得 到 商 和 余数 ， 那 
么 先 计算 x/y 再 计算 x%y 并 不 高 效 。 更 好 的 方法 是 同时 计算 它们 。 








内 置 函数 divmod 接收 两 个 参数 ， 并 返回 两 个 值 的 元 组 ， 即 商 和 余 
数 。 可 以 将 结果 存 为 一 个 元 组 : 


>>> t = divmod(7, 3) 
>>> t 
(2, 1) 





或 者 可 以 使 用 元 组 赋值 来 分 别 存 储 结果 中 的 元 素 : 


>>> quot, rem = divmod(7, 3) 
>>> quot 

2 

>>> rem 


1 





下 面 是 返回 一 个 元 组 的 函数 的 示例 : 


def min max(t): 
return min(t), max(t) 


max 和 min 都 是 内 置 函 数 ， 分 别 返 回 一 个 序列 的 最 大 值 和 最 小 





{Ho min_max 计算 这 两 个 值 并 将 它们 作为 一 个 元 组 返回 。 





12.4 可 变 长 参数 元 组 


函数 可 以 接收 不 定 个 数 的 参数 。 以 * 开头 的 参数 名 会 收集 
(gather) 所 有 的 参数 到 一 个 元 组 上 。 例 如 ，printall 接收 任意 个 数 的 
参数 并 打印 它们 : 


def printall(*args): 
print (args) 


收集 参数 可 以 使 用 任何 你 想 要 的 名 称 ， 但 按 惯 例 通常 使 用 args 。 
下 面 是 函数 如 何 工 作 的 一 个 例子 : 


>>> printall(1, 2.0, '3') 
(1, 2.0, '3') 


收集 的 反面 是 分 散 (scatter) 。 如 果 有 一 个 序列 的 值 而 想 将 它们 作 
为 可 变 长 参数 传 入 到 函数 中 ， 可 以 使 用 * 操作 符 。 例 如 ，divmod 正好 
接收 两 个 参数 ， 但 它 不 接收 元 组 : 


>>> t = (7, 3) 
>>> divmod(t) 


TypeError: divmod expected 2 arguments, got 1 





但 如 果 将 元 组 分 散 ， 束 可 以 用 了 : 


>>> divmod(*t) 
(2, 1) 


pO 


很 多 内 置 函 数 使 用 可 变 长 参数 元 组 。 例 如 ，max 和 min 都 可 以 接收 
任意 个 数 的 参数 : 


>>> max(1, 2, 3) 
3 


但 是 sum 并 不 这 样 。 








>>> sum(1, 2, 3) 
TypeError: sum expected at most 2 arguments, got 3 


作为 练习 ， 编 写 一 个 函数 sumall ， 接 收 任意 个 数 的 参数 并 返回 它 
们 的 和 。 


12.5 列表 和 元 组 


zip 是 一 个 内 置 函 数 ， 接 收 两 个 或 多 个 序列 ， 并 返回 一 个 元 组 列 
表 。 每 个 元 组 包含 来 自 每 个 序列 中 的 一 个 元 素 。 这 个 函数 的 名 字 取 上 自 拉 
BE (zipper) ， 它 可 以 将 两 行 链 牙 交 瞧 连接 起 来 。 





下 面 的 例子 将 字符 串 和 一 个 列表 “ 拉 ? 到 一 起 : 


>>> s = ‘abc' 
>>> t = [0, 1, 2] 
>>> zip(s, t) 


<zip object at @x7f7d@a9e7c48> 








结果 是 一 个 zip 对 象 ， 它 知道 如 何 遍 历 每 个 元 素 对 。 使 用 zip 最 
常用 的 方式 是 在 for 循环 中 : 


>>> for pair in zip(s, t): 
print (pair) 
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ae IRA LETT THR, (ASIAN ce, tea ABE EAD PERR 
择 对 象 。 


如 果 需 要 使 用 列表 的 操作 符 和 方法 ， 可 以 利用 zip 对 象 制作 一 个 列 


>>> list(zip(s, t)) 
[('a', ©), ('b', 1), ('c', 2)] 








结果 是 一 个 由 元 组 组 成 的 列表 。 在 本 例 中 ， 每 个 元 组 包含 字符 串 中 
的 一 个 字符 ， 以 及 列表 中 对 应 的 一 个 元 素 。 





如 果 序 列 之 间 的 长 度 不 同 ， 则 结果 的 长 度 是 所 有 序列 中 最 短 的 那 


个 : 


>>> list(zip('Anne', 'Elk')) 
[('A', 'E'), ('n', "1'), ('n', 'k')] 





可 以 在 for 循环 中 使 用 元 组 赋值 来 访问 元 组 的 列表 : 


t = [('a', Q), ('b', 1), Ce’; 2)] 
for letter, number in 七 : 


print (number, letter) 





每 次 循环 中 ，Python 选 择 列 表 中 的 下 一 个 元 组 ， 并 将 其 元 素 赋 值 给 
letter 和 number 变量 。 这 个 循环 的 输出 如 下 : 


NF © 
OOo w& 


如 果 组 合 使 用 zip . for 循环 以 及 元 组 赋值 ， 可 以 得 到 一 种 有 用 的 


Bask, HAS Teo py ek ee el). BE, has_match 函数 接收 两 个 
序列 ，t1 和 t2 ， 并 当 存 在 一 个 下 标 i 保证 t1[i] == t2[i] 时 返回 


True: 


def has_match(t1, t2): 
for x, y in zip(t1, t2): 
if x == y: 


return True 
return False 
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enumerate : 


for index, element in enumerate('abc'): 
print(index, element) 


SMSO KIS REAR RR, ARRANA, TE 
个 例子 中 ， 每 个 对 都 包含 一 个 下 标 〈 从 0 开始 ) 和 一 个 来 自给 定 序列 的 
元 素 ， 输 出 结果 还 是 ， 


NF © 
Oo w& 


12.6 字典 和 元 组 


字典 有 一 个 items 方法 可 以 返回 一 个 元 组 的 序列 ， 其 中 每 个 元 组 是 
一 个 键 值 对 : 


>>> d 
>>> t 
>>> t 
dict_items([('c', 2), ('a', ©), ('b', 1)]) 


{'a':0, 'b': 
d.items() 





结果 是 一 个 dict_item WR, Ee NERA, P MUARI BE 
个 键 值 对 。 可 以 使 用 for 循环 来 访问 : 


>>> for key, value in d.items() 
print(key, value) 











和 预料 中 一 样 ， 字 典 中 的 项 是 没有 特定 顺序 的 。 
从 反方 回 出 发 ， 可 以 使 用 一 个 元 组 列表 来 初始 化 一 个 新 的 字典 : 


[('a', ©), ('c', 2), ('b', 1)] 
dict(t) 





组 合 使 用 dict 和 zip 可 以 得 到 一 个 简洁 的 创建 字典 的 方法 : 


>>> d = dict(zip('abc', range(3))) 


>>> d 
{'a': @, 'c': 





字典 方法 update 也 接收 一 个 元 组 列表 ， 并 将 它们 作为 键 值 对 添加 
到 一 个 已 有 的 字典 中 。 

使 用 元 组 作为 字典 的 键 很 常见 (主要 是 因为 不 能 使 用 列表 )〉 。 例 
如 ， 一 个 电话 号 人 码 敌 可 能 需要 将 姓名 对 映射 到 电话 号 码 。 假 设 定 义 了 
last, first 和 number ， 可 以 这 么 写 : 


directory[last,first] = number 


在 方 括号 中 的 表达 式 是 一 个 元 组 。 我 们 也 可 以 使 用 元 组 赋值 来 遍历 
这 个 字典 : 








for last, first in directory: 
print(first, last, directory[last, first]) 





这 个 循环 过 历 字 典 directory 的 所 有 键 ， 它 们 都 是 元 组 。 它 将 每 一 
个 元 组 的 元 素 赋值 给 last 和 first ， 接 着 打印 出 名 字 以 及 对 应 的 电话 
号 码 。 








在 状态 图 中 有 两 种 方法 可 以 表达 元 组 。 更 详细 的 版 本 和 列表 一 样 ， 
显示 索引 和 元 素 。 例 如 ， 元 组 ('Cleese'， ‘John') 可 以 如 图 12-1 所 





tuple 





0 —> ’Cleese’ 
1 一 > John’ 


图 12-1 状态 图 


但 是 在 更 大 的 图 中 你 可 能 希望 省 略 掉 细 节 。 例 如 ， 整 个 电话 短 的 图 
如 图 12-2 所 示 。 
dict 
(‘Cleese’, John’) —> ’08700 100 222’ 
Chapman’, ’Graham’) —> ’08700 100 222’ 
(‘Idle’, Eric’) —> ’08700 100 222’ 


(’Gilliam’, Terry’) —> ’08700 100 222’ 
(‘Jones’, Terry’) —> ’08700 100 222’ 
(’Palin’, Michael’) —> ’08700 100 222’ 





图 12-2 ”状态 图 


这 里 元 组 使 用 Python 的 语法 作为 图 形 化 的 简写 展示 。 这 张 图 里 的 电 
话 写 码 是 BBC 的 投诉 热线 ， 所 以 请 不 要 真 去 拨打 它 。 


12.7 FRY FP 





我 一 直 在 聚焦 于 元 组 的 列表 ， 但 本 章 中 几乎 所 有 的 示例 都 可 以 对 列 
表 的 列表 、 元 组 的 元 组 以 及 列表 的 元 组 使 用 。 为 了 避免 枚 举 所 有 的 可 能 
组 合 ， 有 时 候 直 接 说 序列 的 序列 更 简单 。 


在 很 多 环境 中 ， 不 同类 型 的 序列 〈 字 符 串 、 列 表 和 元 组 ) 都 可 以 瑟 
换 使 用 。 应 当 如 何 选择 使 用 哪个 呢 ? 


从 最 明显 的 一 个 开始 ， 字 符 串 比 其 他 序列 有 更 多 限制 ， 因 为 它 的 元 
素 必须 是 字符 。 它 们 也 是 不 可 变 的 。 如 果 你 需要 修改 一 个 字符 串 中 的 字 
符 《〈 而 不 是 新 建 一 个 字符 串 ) ， 可 能 需要 使 用 字符 的 列表 。 





列表 比 元 组 更 加 通用 ， 主 要 因为 它 是 可 变 的 。 但 也 有 一 些 情况 下 你 
可 能 会 优先 选择 元 组 。 





1. 在 有 些 环境 中 ， 如 返回 语句 中 ， 创 建 元 组 比 创建 列表 从 语法 上 
说 更 容易 。 


2. 如 果 雷 要 用 序列 作为 字典 的 键 ， 则 必须 使 用 不 可 变 类 型 ， 如 元 
组 或 字符 串 。 


3. 如 果 你 要 向 函数 传 入 一 个 序列 作为 参数 ， 使 用 元 组 可 能 会 减少 
潜在 的 由 假名 导致 的 不 可 预知 行为 。 





因为 元 组 是 不 可 变 的 ， 它 们 不 提供 类 似 sort 和 reverse 之 类 的 方 
法 ， 这 些 方 法 修改 现 有 的 序列 。 但 Python 也 提供 了 内 置 函数 sorted , 


可 以 接收 任何 序列 作为 参数 ， 并 按 排 好 的 顺序 返回 带 有 同样 元 素 的 新 列 
表 。Python 还 提供 了 reverse ， 可 以 接收 序列 作为 参数 ， 并 返回 一 个 以 
相反 顺序 遍历 列表 的 迭代 器 。 


12.8 ”调试 





列表 、 字 典 和 元 组 都 被 统一 看 作 是 一 种 数据 结构 。 本 章 中 我 们 开 
始 看 到 复合 数据 结构 ， 像 元 组 的 列表 ， 或 者 用 元 组 做 键 、 用 列表 做 值 的 
字典 等 。 复 合 数据 结构 很 有 用 ， 但 它 容 易 导 致 我 称 为 的 结构 错误 ; 也 
就 是 说 ， 数 据 结构 因为 错 的 类 型 、 大 小 或 结构 导致 的 错误 。 例 如 ， 如 宁 
你 期 望 得 到 一 个 包含 单个 整数 的 列表 ， 而 我 给 你 一 个 单个 整数 《而 不 是 
在 列表 中 ) ， 就 会 出 错 。 


为 了 帮助 调试 这 种 问题 ， 我 写 了 一 个 模块 structshape ， 提 供 一 
个 也 叫 作 structshape 的 函数 ， 接 收 任何 数据 类 型 作为 参数 ， 并 返回 
一 个 描述 它 的 形状 的 字符 串 。 你 可 以 从 
http://thinkpython2.com/code/structshape.py 下 载 它 。 


下 面 是 一 个 简单 列表 的 结果 : 


>>> from structshape import structshape 
>>> t = [1,2,3] 
>>> structshape(t) 


‘list of 3 int' 





更 好 看 的 程序 可 能 会 输出 "list of 3 ints”， 但 不 需要 处 理 复 数 更 加 容 
易 。 下 面 是 列表 的 列表 : 


>>> t2 = [[1,2], [3,4], [5,6]] 
>>> structshape(t2) 


"list of 3 list of 2 int' 








如 果 列 表 的 元 素 不 是 同一 种 类 型 ，structshape 会 根据 它们 的 类 
型 按 顺序 分 组 : 


>>> t3 = [1, 2, 3, 4.0, '5', '6', [7], [8], 9] 
>>> structshape(t3) 


'list of (3 int, float, 2 str, 2 list of int, int)' 





下 面 是 元 组 的 列表 : 


>>> s = ‘abc' 

>>> lt = list(zip(t, s)) 

>>> structshape(l1t) 

‘list of 3 tuple of (int, str)' 
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>>> d = dict(1t) 
>>> structshape(d) 


"dict of 3 int->str' 





如 果 你 发 现 要 记 住 数 据 结构 有 困难 ，structshape 可 以 帮忙 。 


12.9 ÑEK 





元 组 (tuple) : 一 个 不 可 变 的 元 素 序 列 。 


元 组 赋值 (tuple assignment) : 一 个 赋值 语句 ， 右 侧 是 一 个 序列 ， 
左 侧 是 一 个 变量 的 元 组 。 右 边 的 序列 会 被 求 值 ， 它 的 元 素 依 次 赋值 给 左 
侧 元 组 中 的 变量 。 


收集 (gather) : 组 装 可 变 长 参数 元 组 的 操作 。 
分 散 Cscatter) : 把 一 个 序列 当 作 参数 列表 的 操作 。 


zip 对 象 (zip object) : 调用 内 置 函 数 zip 的 结果 ， 它 是 一 个 迭代 
访问 由 元 组 组 成 的 序列 的 对 象 。 


kRAS iterator) : 可 以 壳 历 序列 的 对 象 ， 但 它 不 提供 列表 的 操作 
和 方法 。 
数据 结构 (data structure) : 相关 的 值 的 集合 ， 通 和 组 织 成 列表 、 


字典 、 元 组 等 。 


结构 错误 (shape error) : 某 个 值 由 于 其 结构 不 对 导致 的 错误 ， 即 
它 的 类 型 或 尺寸 不 对 。 


12.10 ”练习 


练习 12-1 


编写 一 个 函数 most_frequent ， 接 收 一 个 字符 串 并 按照 频率 的 降 
序 打印 字母 。 从 不 同 语言 中 查找 文本 样 例 并 查看 不 同 语言 中 的 单词 频率 
如 何 变 化 。 将 你 的 结果 和 http://en.wikipedia.org/wiki/Letter_frequencies 上 
的 列表 进行 对 比 。 


解答 : http://thinkpython2.com/code/most_frequent.py。 
练习 12-2 
更 多 回 文 ! 


1. 编写 一 个 程序 从 文件 中 读 入 一 个 单词 列表 《参见 9.1 节 ) 并 打印 
出 所 有 是 回 文 的 单词 集合 。 


下 面 是 输出 的 样子 的 示例 : 


'deltas', 'desalt', 'lasted', 'salted', 'slated', ‘staled'] 
'retainers', 'ternaries'] 
'generating', 'greatening'] 


'resmelts', 'smelters', 'termless'] 





提示 : 你 可 能 需要 构建 一 个 字典 将 字母 的 集合 映射 到 可 以 用 这 些 字 
母 构 成 的 单词 的 列表 上 。 问 题 是 ， 如 何 表达 字母 集合 ， 才 能 让 它 可 以 用 
作 字典 的 键 ? 


2. 修改 前 一 个 问题 的 程序 ， 让 它 先 打印 最 大 的 回 文 列表 ， 再 打印 
第 二 大 的 回 文 列表 ， 依 次 类 推 。 





3. 在 Scrabble 拼 字 游 戏 中 ， 一 个 “bingo” 代 表 你 自己 架子 上 全 部 7 个 
字母 和 盘 上 的 一 个 字母 组 合成 一 个 8 字母 单词 。 哪 一 个 8 字母 单词 可 以 生 
成 最 多 的 bingo? 提示 : 一 共有 7 个 。 





解答 : http://thinkpython2.com/code/anagram_sets.py。 
练习 12-3 


两 个 单词 ， 如 果 可 以 通过 交换 两 个 字母 将 一 个 单词 转换 为 另 一 个 ， 
DIAS Be”; 例如, “converse” 和 “conserve”。 编 写 一 个 程序 查找 字 
典 中 所 有 的 置换 对 。 提 示 : 不 要 测试 所 有 的 单词 对 ， 也 不 要 测试 所 有 可 
能 的 交换 。 


解答 : hhttp://thinkpython2.com/code/metathesis.py - 
鸣谢 : 这 个 练习 局 发 自 http:/puzzlers.org 的 示例 。 
练习 12-4 


Pit (FRAP) HAPS 


Chttp://www.cartalk.com/content/puzzlers ) : 





一 个 英文 单词 ， 当 逐个 删除 它 的 字母 时 ， 仍 然 是 英文 单词 。 这 样 的 
单词 中 最 长 的 是 什么 ? 


首先 ， 人 字母 可 以 从 两 头 或 者 中 间 删 除 ， 但 你 不 能 重 排 字 母 。 每 次 你 





去 掉 一 个 字母 ， 则 得 到 男 一 个 英文 单词 。 如 果 一 直 这 么 做 ， 最 终 会 得 到 
一 个 字母 ， 它 本 身 也 是 一 个 英文 单词 一 一 可 以 从 字典 上 找到 的 。 我 想 知 
道 这 样 的 最 长 的 单词 是 什么 ， 它 有 多 少 字 母 ? 





我 会 给 你 一 个 普通 的 例子 : Sprite。 你 从 sprite 开 始 ， 取 出 一 个 字 
母 ， 从 单词 内 部 取 ， 取 走 r， 这 样 我 们 就 剩 下 单词 spite， 接 着 我 们 取 走 
结尾 的 se， 剩 下 spit， 接 痢 取 走 s， 我 们 剩 下 pit、it 和 I。 





编写 一 个 程序 来 找到 所 有 可 以 这 样 缩减 的 单词 ， 然 后 找到 最 长 的 一 


ANG 


这 个 练习 比 大 部 分 练习 都 更 有 挑战 ， 所 以 下 面 有 一 些 建议 。 





1. 你 可 能 需要 编写 一 个 程序 接收 一 个 单词 ， 并 计算 出 所 有 通过 从 
它 取 出 一 个 字母 得 到 的 单词 的 列表 。 它 们 是 这 个 单词 的 “了 ”单词 。 








2， 递归 地 ， 只 有 当 一 个 单词 的 子 单词 中 有 一 个 可 缩减 时 ， 它 才 可 
缩减 。 作 为 一 个 基准 情形 ， 你 可 以 认为 空 字符 串 可 缩减 。 


3. 我 提供 的 单词 表 ，words .txt ， 并 不 存在 单个 字母 的 单词 。 所 
以 你 可 能 需要 加 上 “I”、“a” 和 空 字 符 串 。 








4 为 了 提高 程序 的 效率 ， 你 可 能 需要 记 住 已 知 的 可 缩减 的 单词 。 


解答 : http://thinkpython2.com/code/reducible.py。 


第 13 章 ”案例 研究 : 选择 数据 结构 


到 这 里 你 应 该 已 经 学 
用 它们 的 算法 。 如 果 你 想 
下 面 的 内 容 之 前 那 部 分 内 
阅读 。 


会 了 Python 的 核心 数据 结构 ， 也 见 过 了 一 些 使 
要 更 多 地 了 解 算法 ， 可 以 阅读 第 21 草 。 但 继续 
容 并 不 是 必需 要 读 懂 ， 你 可 以 随感 兴趣 时 时 去 


本 章 配 合 练习 介绍 一 个 案例 分 析 ， 必 你 思考 如 何 选择 数据 结构 并 如 
何 实际 使 用 它们 。 


13.1 单词 频率 分 析 


和 前 面 的 章节 一 样 ， 应 当 人 至 少 尝 试 一 下 解决 问题 ， 再 看 我 的 解答 。 
练习 13-1 


编写 一 个 程序 ， 读 入 一 个 文件 ， 将 每 行内 容 拆 解 为 单词 ， 剥 去 单词 
周围 的 空白 字符 和 标点 ， 并 转换 为 小 写 。 


提示 : string 模块 提供 了 空白 字符 串 whitespace ， 包 括 空 格 、 


制 表 符 、 换 行 符 等 ， 它 也 提供 了 punctuation ， 包 含 了 所 有 的 标点 字 
符 。 让 我 们 试 试 能 不 能 让 Python 胡言 乱 语 : 


>>> import string 
>>> string.punctuation 


88 ()*4,-6/25<=>27@L\ {|} 





另外 ， 也 可 以 考虑 字符 串 方 法 strip . replace {translate 。 
练习 13-2 


去 往 古 腾 堡 工程 〈Project Gutenberg, http://www.gutenberg.org ) 并 
下 载 你 最 喜欢 的 无 版 权 书籍 的 纯 文 本 文档 。 


修改 前 一 个 练习 中 的 程序 ， 改 为 从 你 下 载 的 书籍 中 读 取 内 容 ， 跳 过 
文件 开头 的 信息 部 分 ， 并 和 前 面 一 样 将 文本 处 理 成 为 单词 。 





接着 修改 程序 ， 计 算 书 中 出 现 的 全 部 单词 的 总 数 ， 以 及 每 个 单词 使 


用 的 次 数 。 


打印 书 中 使 用 的 不 同 单词 的 个 数 。 比 较 不 同时 代 、 不 同 作者 的 不 同 
书籍 。 哪 一 个 作者 使 用 的 词汇 最 广泛 ? 


练习 13-3 
修改 前 一 个 练习 中 的 程序 ， 计 算 书 中 使 用 频率 最 高 的 20 个 单词 。 
练习 13-4 


修改 前 面 的 程序 ， 读 入 一 个 单词 表 (参见 9.1 市 ) 并 打印 出 书 中 所 
有 不 在 单词 表 之 中 的 单词 。 这 其 中 有 多 少 是 拼写 错误 ? 有 多 少 是 应 该 出 
现在 单词 表 中 的 第 用 单词 ? 有 多 少 是 真正 冷 僻 的 单词 ? 














13.2 ”随机 数 





给 定 相同 的 输入 ， 大 部 分 计算 机 程序 每 次 运行 都 会 生成 相同 的 输 
出 ， 所 以 它们 被 认为 是 有 确定 性 的 。 确 定性 通常 是 件 好 事 ， 因 为 我 们 
希望 相同 的 计算 能 有 相同 的 结果 。 但 对 某 些 特别 的 应 用 ， 我 们 希望 计算 
机 是 不 可 预测 的 。 游 戏 是 一 个 明显 的 例子 ， 但 还 有 更 多 类 似 的 例子 。 














让 程序 变 得 真正 地 不 确定 很 难 ， 但 也 有 办 法 让 它 至 少 看 起 来 是 不 确 
定 的 。 一 种 办 法 是 使 用 算法 来 生成 伪 随 机 数 。 伪 随机 数 并 不 是 真正 随 
机 的 ， 因 为 它们 是 通过 一 个 确定 性 的 算法 生成 的 ， 但 若 只 看 输出 的 数字 
的 话 ， 几 乎 不 可 能 看 出 来 和 随机 数 有 什么 区 别 。 





模块 random 提供 了 用 于 生成 伪 随 机 数 的 函数 〈 接 下 来 我 直接 简单 
地 将 它 称 为 “随机 数 ”) 。 


函数 random 返回 一 个 从 0.0 到 1.0 之 间 的 随机 浮 点 数 〈 包 括 0.0， 但 
不 包括 1.0) 。 每 当 调 用 random 时 ， 会 得 到 一 个 很 长 的 随机 数 序列 中 的 
一 个 数 。 运 行 下 面 的 循环 ， 可 以 看 到 一 个 样本 : 


import random 


for i in range(1@): 


x = random.random() 
print(x) 





函数 randint 接收 参数 low 和 high ， 并 返回 low 和 high 之 间 (两 
者 都 包含 ) 的 一 个 整数 。 


random.randint(5, 10) 


random.randint(5, 10) 





要 从 序列 中 随机 选择 一 个 元 素 ， 可 以 使 用 choice : 


>>> t = [1, 2, 3] 
>>> random.choice(t) 
2 

>>> random.choice(t) 


3 








random 模块 还 提供 了 可 以 从 各 种 连续 分 布 序列 中 生成 随机 数 的 函 
数 ， 包 括 高 斯 分 布 、 指 数 分 布 、Y 分 布 以 及 其 他 几 种 。 





练习 13-5 


编写 一 个 函数 choose_from_hist ， 接 收 一 个 11.1 节 所 定义 的 直方 
图 作为 参数 ， 并 从 这 个 直方 图 中 ， 按 照 频率 的 大 小 ， 成 比例 地 随机 返回 
一 个 值 。 例 如 ， 对 下 面 这 个 直方 图 : 





>>> t= ["a"; ‘a', "b’'] 
>>> hist = histogram(t) 
>>> hist 


{'a': 2, 'b': 1} 





你 的 函数 应 该 以 2/3 的 概率 返回 'a' ， 以 /3 的 概率 返回 'b' 。 


13.3 单词 直方 图 


在 继续 阅读 之 前 你 应 当 答 试 前 面 的 练习 。 你 可 以 从 
http://thinkpython2.com/code/ analyze_bookl.py 下 载 我 的 解答 。 你 还 需要 
http://thinkpython2.com/code/emma.txt. 


下 面 是 一 个 读 取 文件 并 从 文件 中 的 单词 构造 直方 图 的 例子 : 


import string 


def process file(filename): 
hist = dict() 
fp = open(filename) 
for line in fp: 
process line(line, hist) 
return hist 


def process line(line, hist): 
line = line.replace('-', ' ' 


for word in line.split(): 


word = word.strip(string.punctuation + string.whitespace) 
word = word. lower() 


hist[word] = hist.get(word, ©) + 1 


hist = process file('emma.txt' ) 





这 个 程序 读 入 emma .txt ， 其 内 容 是 简 : 奥 斯 本 的 《 爱 玛 》 的 文本 。 





process_file 循环 遍历 文件 中 的 每 一 行 ， 每 次 将 一 行 传递 给 
process_line 函数 。 直 方 图 hist 用 作 累 加 器 。 


process_line 使 用 字符 串 方 法 replace 将 '-' 符号 替换 为 空格 ， 


再 使 用 split 将 各 行文 本 拆 分 成 一 个 字符 串 列 表 。 它 过 有 历 单词 列表 ， 使 
用 strip 和 lower 去 除 掉 标 点 符号 并 转换 为 小 写 。《 我 们 说 “转换 ?”， 只 
是 个 简称 ， 记 住 字 符 串 是 不 可 变 的 ， 所 以 strip 和 ]ower 这 样 的 方法 返 
回 的 是 新 字符 串 。) 


最 后 ，process_line 通过 创建 新 项 或 者 增加 旧 有 项 的 值 来 更 新 直 
方 图 。 








要 计算 文件 中 单词 的 总 数 ， 我 们 可 以 累加 直方 图 中 的 频率 : 


def total_words(hist): 
return sum(hist.values()) 





不 同 单词 的 个 数 ， 就 是 字典 里 的 元 系数 量 : 


def different_words(hist): 
return len(hist) 





下 面 是 打印 结果 的 代码 : 


print('Total number of words:', total_words(hist) ) 
print('Number of different words:', different_words(hist) ) 





以 及 结果 : 


Total number of words: 161080 
Number of different words: 7214 





13.4 ”最 利用 的 单词 


要 寻找 最 童 用 单词 ， 我 们 可 以 生成 一 个 元 组 的 列表 ， 其 中 每 个 元 组 
包括 一 个 单词 及 其 频率 ， 并 对 其 进行 排序 。 


下 面 的 函数 接收 一 个 直方 图 ， 并 返回 “单词 -频率 ”元 组 的 列表 : 


def most_common(hist): 
t=] 
for key, value in hist.items(): 
t.append((value, key)) 


t.sort(reverse=True) 
return t 





在 每 个 元 组 中 ， 频 率先 出 现 ， 所 以 结果 列表 按 频 率 排序 。 下 面 的 循 
环 打印 出 最 常用 的 10 个 单词 : 


t = most_common(hist) 

print('The most common words are:') 

for freq, word in t[:10]: 
print(word, freg, sep='\t') 





这 里 我 使 用 关键 字 参 数 sep 通知 print 去 使 用 制 表 符 作为 分 隔 符 ， 
而 不 使 用 空格 。 于 是 第 二 列 可 以 对 其 排列 。 下 面 是 《 爱 玛 》 的 结果 : 








The most common words are: 


to 5242 
the 5205 
and 4897 
of 4295 


a 3130 


it 2529 
her 2483 
was 2400 
she 2364 





这 段 代 码 可 以 用 sort 函数 的 key 参数 进行 简化 。 如 果 你 有 兴趣 ， 
可 以 读 一 下 相关 的 文章 : http://wiki.python.org/moin/HowTo/Sorting。 


13.5 PERK 


我 们 已 经 见 过 一 些 接收 可 选 形 参 的 内 置 函 数 和 方法 。 用 户 也 可 以 编 
写 接 收 可 选 形 参 的 自 定 义 函 数 。 例 如 ， 下 面 的 函数 打印 一 个 直方 图 中 最 
常见 的 单词 : 


def print_most_common(hist, num=10): 
t = most_common(hist) 
print('The most common words are:') 


for freq, word in t[:num]: 
print(word, freg, sep='\t') 





第 一 个 形 参 是 必需 的 ， 第 二 个 是 可 选 的 。 形 参 num 的 默认 值 是 


如 果 只 提供 一 个 实 参 : 


print_most_common(hist) 


num 会 获得 默认 值 。 如 果 提 供 两 个 实 参 : 


print_most_common(hist, 20) 


num Wl ak ter heck A. A, EKSER it, 默认 形 
FAB 


如 果 一 个 函数 既 有 必需 形 参 ， 也 有 可 选 形 参 ， 则 所 有 的 必需 形 参 都 
必须 在 前 面 ， 后 面 跟着 可 选 形 参 。 


13.6 字典 减法 


寻找 在 书 中 出 现 却 不 在 words .txt 单词 表 中 的 单词 ， 这 个 问题 可 以 
看 作 是 集合 减法 ;也 就 是 说 ， 我 们 想 要 找到 出 现在 一 个 集合 《〈 书 中 的 单 
词 ) 而 不 在 另 一 个 集合 《单词 表 中 的 单词 ) 的 所 有 单词 。 





subtract 函数 接收 两 个 字典 d1 和 d2 ， 并 返回 一 个 新 的 字典 ， 包 
含 所 有 出 现在 d1 中 且 不 出 现在 d2 中 的 键 值 。 由 于 我 们 并 不 真 的 关心 字 
典 的 值 ， 我 们 将 所 有 值 都 设 为 None。 


def subtract(d1, d2): 
res = dict() 
for key in d1: 
if key not in d2: 


res[key] = None 
return res 





要 找 出 书 中 出 现 而 不 在 words .txt 单词 表 中 的 词 ， 我 们 可 以 使 
用 process_file 为 words .txt 建立 一 个 直方 图 ， 再 使 用 减法 : 


words = process file('words.txt' ) 
diff = subtract(hist, words) 


print("Words in the book that aren't in the word list:") 


for word in diff: 
print(word, end=' ') 








下 面 是 《 爱 玛 》 一 书 中 的 部 分 结果 : 
[Words in the book that aren't in the word list: | 


rencontre jane's blanche woodhouses disingenuousness 
friend's venice apartment ... 











这 些 词 中 有 些 是 名 字 或 所 有 格 单词 。 其 他 的 ， 如 “rencontre”， 已 经 











不 再 常用 。 但 也 有 一 些 是 真 应 该 包含 在 单词 表 中 的 ! 
练习 13-6 


Python 提 供 了 一 个 数据 结构 set ， 它 提供 了 很 多 常见 的 集合 操作 。 
你 可 以 读 19.5 市 中 关于 集合 操作 的 内 容 ， 或 者 阅读 http://docs.python. 
org/3/library/stdtypes.html#types-set 上 的 文档 ， 并 编写 一 个 程序 使 用 集合 
减法 来 寻找 出 现在 书 中 但 不 出 现在 单词 表 中 的 单词 。 解 答 : 
http://thinkpython2.com/code/ analyze_book2.py。 


13.7 随机 单词 


各 要 从 直方 图 中 随机 选择 一 个 单词 ， 最 简单 的 算法 是 根据 计算 得 到 
的 频率 构建 一 个 列表 ， 其 中 每 个 单词 根据 词 频 有 多 个 拷贝 ， 并 从 中 随机 
选择 一 个 单词 : 
def random_word(h): 

t= [] 


for word, freq in h.items(): 
t.extend([word] * freq) 


return random.choice(t) 





表达 式 [word] * freq 创建 一 个 列表 ， 里 面 有 单词 word 的 freq 
个 副本 。extend 方法 和 append 类 似 ， 区 别 是 接收 的 参数 是 一 个 序列 。 


这 个 算法 可 以 使 用 ， 但 效率 并 不 高 ; 每 当选 择 一 个 随机 单词 时 ， 它 
会 重建 列表 ， 而 这 个 列表 和 原 书 差不多 长 。 一 个 明显 的 改进 方法 是 只 建 
并 列表 一 次 ， 再 使 用 多 次 选择 ， 但 这 么 做 列表 仍然 很 大 。 


更 好 的 丛 代 方案 如 下 。 
1. 使 用 keys 来 获得 书 中 所 有 的 单词 的 列表 。 


2. 构建 一 个 列表 ， 包 含 单 词 频率 的 累积 和 【参见 练习 10-2) 。 这 
个 列表 中 的 最 后 一 项 是 书 中 单词 的 总 数 mn 。 








3. 在 1 到 n 之 间 随 机 选择 一 个 数 。 使 用 二 分 查找 (参见 练习 10-11) 





来 找到 随机 数 在 累积 和 列表 中 应 该 出 现 的 位 置 的 下 标 。 
4. 使 用 这 个 下 标 ， 在 单词 表 中 找到 相应 的 单词 。 
练习 13-7 
编写 一 个 程序 ， 使 用 这 个 算法 来 从 书 中 选择 一 个 随机 的 单词 。 


解答 : http://thinkpython2.com/code/analyze_book3.py 。 


13.8 马尔 可 夫 分 析 


如 果 你 从 书 中 随机 地 获取 单词 ， 可 以 借 此 感受 一 下 书 中 的 词汇 ， 但 
可 能 无 法 通过 随机 获取 来 得 到 一 句 话 : 


this the small regard harriet which knightley's it most things 


一 个 随机 单词 的 序列 ， 很 难 组 成 有 意义 的 话 ， 因 为 相 邻 的 词 之 间 没 
有 任何 关联 。 例 如 ， 在 一 个 真实 的 句子 中 ， 冠 词 <the" 应 当 会 后 接 一 个 形 
容 词 或 名 词 ， 而 不 应 是 动词 或 副词 。 





测量 这 种 类 型 的 关联 的 方法 之 一 是 使 用 马尔 可 夫 分 析 ， 它 能 够 用 于 
描述 给 定 的 单词 序列 中 下 一 个 可 能 出 现 的 单词 的 概率 。 例 如 ， 歌 曲 
«Eric, the Half a Bee》 的 开头 是 : 


Half a bee, philosophically, 
Must, ipso facto, half not be. 
But half the bee has got to be 
Vis a vis, its entity. D’you see? 
But can a bee be said to be 


Or not to be an entire bee 


When half the bee is not a bee 


Due to some ancient injury? 





在 这 段 文本 中 ， 短 语 “half the”" 总 是 后 接着 单词 "bee”， 但 短语 “the 
bee” 则 可 能 后 接 “has” 或 “is”。 


马尔 可 夫 分 析 的 结果 是 一 个 从 每 个 前 级 (如 “half the” 和 “the bee”) 
到 其 所 有 可 能 后 级 (如 “has” 和 “is”) 的 映射 。 


给 定 这 种 映射 后 ， 你 就 可 以 用 它 来 生成 随机 文本 。 从 任意 前 缀 开 
台 ， 并 从 它 的 可 能 后 绥 中 随机 选择 一 个 。 接 着 ， 你 可 以 将 前 绥 的 结尾 和 
后 级 组 合 起 来 ， 作 为 下 一 个 前 级 ， 并 继续 重复 。 


例如 ， 如 果 你 以 前 级 “Half a" 开 始 ， 则 接 下 来 一 个 单词 必定 
是 “bee”， 因 为 这 个 前 级 在 文本 中 只 出 现 了 一 次 。 下 一 个 前 级 是 “a 
bee”， 所 以 下 一 个 后 级 可 能 是 “philosophically”be” 或 者 “due”。 





在 这 个 例子 中 前 缀 的 长 度 总 是 2， 但 其 实 你 可 以 使 用 任意 前 绥 长 度 
来 进行 马尔 可 夫 分 析 。 


练习 13-8 
马尔 可 夫 分 析 : 


1. 编写 一 个 程序 从 文件 中 读 入 文本 ， 并 进行 马尔 可 夫 分 析 。 结 果 
应 该 是 一 个 字典 ， 将 前 级 映射 到 可 能 后 级 的 集合 。 集 合 可 以 是 列表 、 元 
组 或 者 字典 ; 由 你 来 做 出 合适 的 选择 。 你 可 以 使 用 前 绥 长 度 2 来 测试 程 
序 ， 但 编写 程序 时 应 当 考 虑 可 以 方便 地 改 为 其 他 前 级 长 度 。 


2. 在 前 面 编写 的 程序 中 添加 一 个 函数 ， 基 于 马尔 可 夫 分 析 的 结果 
随机 生成 文本 。 下 面 是 一 个 从 《 爱 玛 》 中 使 用 前 级 长 度 2 生成 的 例子 : 


He was very clever, be it sweetness or be angry, ashamed or only 
amused, at such a stroke. She had never thought of Hannah till you were 
never meant for me?” “I cannot make speeches, Emma:” he soon cut it all 


himself. 





对 这 个 例子 ， 我 留 下 了 每 个 单词 后 面 的 标点 。 络 果 几 乎 是 语法 正确 
的 ， 但 也 不 完全 对 。 语 义 上 ， 它 看 起 来 很 像 是 有 意义 的 ， 但 也 不 完全 


H 
KE o 








当 增 加 前 级 长 度 时 ， 结 果 会 怎么 样 ? 随机 生成 的 文本 会 不 会 看 来 更 


意义 ? 








3. 一 旦 你 的 程序 可 以 正常 运行 后 ， 可 以 考虑 尝试 一 下 混搭 : 如 果 
对 两 本 或 更 多 本 书 进行 组 合 ， 则 生成 的 随机 文本 会 以 一 种 有 趣 的 方式 混 
合 各 书 中 的 词汇 和 短语 。 





致谢 : 本 案例 分 析 基 于 Kernighan 和 Pike 的 The Practice of 
Programming (Addison-Wesley, 1999) 一 书 中 的 一 个 示例 。 


你 应 当 在 继续 阅读 前 答 试 这 个 练习 ， 接 着 可 从 
http://thinkpython2.com/code/ markov.py 下 载 我 的 解答 。 你 也 需要 
http://thinkpython2.com/code/emma.txt. 


13.9 ”数据 结构 


使 用 马尔 可 夫 分 析 生 成 随机 文本 很 有 趣 ， 但 这 个 练习 还 有 一 个 要 
点 : 数据 结构 的 选择 。 在 前 面 的 练习 中 ， 你 需要 选择 : 


。 如 何 表 达 前 级 ; 
。 如 何 表 达 可 能 的 后 级 的 集合 ; 
。 如 何 表 达 每 个 前 级 到 可 能 后 级 的 集合 的 映射 。 


最 后 一 个 选择 很 简单 ， 要 从 键 映射 到 对 应 的 值 ， 字 典 是 最 自然 的 选 


对 前 绥 来 说 ， 最 明显 的 选择 是 字符 串 、 字 符 串 列表 或 者 字符 串 元 
组 。 对 后 缀 来 说 ， 一 种 选择 是 列表 ， 另 一 种 是 直方 图 (字典 ) 。 





你 会 如 何 选择 ? 第 一 步 需要 思考 每 种 数据 结构 需要 实现 的 操作 。 对 
前 绥 而 言 ， 我 们 需要 能 够 从 前 方 删除 一 个 单词 ， 并 在 后 方 添加 一 个 单 
词 。 例 如 ， 如 果 当 前 的 前 组 是 "Half a*， 而 下 一 个 单词 是 <bee"， 则 需要 


能 够 构造 下 一 个 前 缀 ，“a bee”. 


你 的 第 一 个 选择 可 能 是 列表 ， 因 为 列表 添加 和 删除 元 又 部 很 方便 。 
但 我 们 也 需要 使 用 前 绥 作 为 字典 的 键 ， 所 以 列表 被 排除 掉 。 对 元 组 而 
言 ， 昌 然 你 不 能 附加 或 删除 ， 但 可 以 使 用 加 法 操作 符 来 构建 一 个 新 的 元 


def shift(prefix, word): 
return prefix[1:] + (word, ) 


Ss 


PO 
shift 接收 一 个 单词 的 元 组 、prefix ， 以 及 一 个 字符 串 word ， 并 
构建 一 个 新 的 元 组 ， 包 含 prefix 中 除了 第 一 个 之 外 的 元 素 ， 并 把 word 
添加 在 最 后 。 
对 后 缀 集合 而 言 ， 我 们 需要 进行 的 操作 包括 添加 一 个 新 的 后 级 (或 
者 增加 一 个 已 有 后 级 的 频率 ) ， 以 及 随机 选择 一 个 后 级 。 





添加 一 个 新 后 级 ， 使 用 列表 实现 或 者 直方 图 实现 效 京 上 相同 。 从 一 
个 列表 中 随机 选择 元 素 很 简单 ， 从 直方 图 中 随机 选择 则 更 难 一 些 (参见 
练习 13-7) 。 


到 此 为 止 我 们 一 直 在 讨论 实现 的 简易 性 ， 但 选择 数据 结构 时 ， 还 有 
其 他 需要 考虑 的 因 系 。 一 个 是 运行 时 间 。 有 了 时候， 我 们 可 以 从 理论 上 预 
期 一 种 数据 结构 比 力 一 种 更 快 ， 例 如 ， 我 所 到 过 in REF, SNRA 
量 很 大 时 ， 在 人 字典 中 使 用 比 在 列表 中 快 。 








但 哪 种 实现 会 更 快 常常 无 法 事先 预知 。 一 个 办 法 是 两 种 都 实现 ， 青 
比较 哪个 更 快 。 这 种 方法 称 为 基准 比较 (benchmarking) 。 比 较 实际 的 
方案 是 先 选择 最 容易 实现 的 数据 结构 ， 然 后 看 它 是 否 对 预期 的 程序 而 言 
足够 快 。 如 果 已 经 足够 ， 则 不 需要 变动 否则， 可 以 使 用 profile 模块 
之 类 的 工具 ， 发 现 程序 中 哪些 地 方 占 用 了 最 长 的 时 间 。 





为 一 个 考虑 因素 是 存储 空间 。 例 如 ， 使 用 直方 图 来 保存 后 级 集合 可 
能 占用 较 少 空间 ， 因 为 不 论 一 个 单词 在 文本 中 出 现 多 少 次 ， 你 只 需要 保 
存 一 次 。 有 的 情况 下 ， 节 省 空间 也 可 以 让 你 的 程序 运行 更 快 ， 而 在 极端 
的 情形 中 ， 如 条 导致 内 存 溢出 ， 则 程序 无 法 正常 运行 。 但 对 大 多 数 程序 























来 说 ， 存 储 空间 是 次 于 运行 速度 的 第 二 考虑 因素 。 





最 后 一 点 : 在 这 个 讨论 中 ， 对 于 分 析 和 生成 两 个 过 程 ， 我 暗示 了 我 
们 应 当 使 用 相同 的 数据 结构 。 但 因为 这 是 两 个 分 开 的 阶段 ， 所 以 也 可 以 
在 分 析 阶 段 使 用 一 种 数据 结构 ， 再 转换 为 男 一 种 数据 结构 用 于 生成 阶 
段 。 如 采 新 的 数据 结构 在 生成 阶段 节省 的 时 间 大 于 转换 花费 的 时 间 ， 则 
总 的 来 说 是 有 利 的 。 








13.10 “调试 





当 在 调试 程序 时 ， 尤 其 是 对 付 一 个 困难 的 bug 时 ， 可 以 尝试 下 面 5 
Frio 


阅读 


审阅 你 的 代码 ， 对 目 己 读 出 来 ， 并 检查 它 是 否 和 你 想 说 的 一 致 。 


运行 





做 一 些小 修改 并 进行 试验 ， 或 者 运行 不 同 的 版 本 。 通 常 如 果 在 程序 
中 正确 的 地 方 加 上 正确 的 输出 ， 问 题 束 会 变 得 更 加 显而易见 。 但 有 时 候 
你 需要 构建 一 个 脚手架 。 





Xy 


沉思 


ACME TAS! 可 能 是 哪 种 类 型 的 错误 : 语法 的 、 运 行 时 的 还 是 语 
义 的 ?从 错误 消 妃 或 程序 输出 中 可 以 得 到 什么 信息 ? 哪 种 错误 可 能 导致 
你 看 到 的 问题 ? 在 问题 出 现 之 前 ， 你 的 最 后 一 次 修改 是 什么 ? 














AR BLAS Vid a 


如 果 你 回 其 他 人 解释 过 到 的 问题 ， 有 时 候 能 在 说 完 问 题 之 前 就 找到 


答案 。 通 常 你 甚至 不 需要 找 人 去 诉说 ， 而 只 雷 要 对 橡皮 鸭 诉 说 即 可 。 这 
就 是 著名 的 橡皮 鸭 调 试 (rubber duck debugging) 的 来 源 。 这 可 不 是 我 
编 出 来 的 ， 参 见 https://en wikipedia.org/wiki/ Rubber_duck_debugging. 


回 退 


在 茶 种 情况 下 ， 最 好 的 办 法 就 是 回 退 ， 撤 销 最 近 的 修改 ， 直 到 你 的 
程序 恢复 到 之 前 没有 错误 且 能 够 理解 的 程度 。 然 后 可 以 开始 重新 构建 。 








新 手 程序 员 有 时 会 卡 在 这 些 环节 中 的 茶 一 个 上 ， 却 筷 了 还 可 以 答 试 
其 他 的 环节 。 每 个 环节 都 有 其 独自 的 失败 模式 。 





例如 ， 妆 问题 是 一 个 拼写 错误 时 ， 赔 读 代码 可 以 帮忙 ， 但 奉 问 题 是 
概念 误解 导致 ， 束 没有 效果 了。 如 果 你 不 理解 自己 的 程序 ， 那 么 即使 阅 
读 100 抽 ， 也 发 现 不 了 问题 ， 因 为 错误 是 在 你 大 脑 中 的 。 





运行 一 些 试验 代码 可 以 起 到 很 大 帮助 ， 尤 其 是 那些 短小 而 简单 的 测 
试 程序 。 但 如 果 你 没有 思考 或 阅读 代码 就 运行 试验 代码 ， 则 可 能 会 陷入 
我 称 之 为 “随机 走动 编程 ”的 模式 之 中 。 即 坚 无 目标 地 随机 改变 程序 ， 直 
到 程序 正确 运行 为 止 。 坚 无 疑问 ， 随 机 走动 编程 可 能 要 人 花费 很 长 的 时 
间 。 











你 必需 花 一 定 的 时 间 去 思考 。 调 试 就 像 是 一 门 实验 科学 。 你 应 当 至 
少 有 一 个 关于 这 个 问题 的 假设 。 如 果 有 两 个 以 上 的 可 能 性 ， 可 以 试 着 构 
思 一 个 测试 来 排除 其 中 一 个 。 


但 如 采 有 太 多 错误 ， 或 者 你 要 修正 的 代码 太 大 太 复 洒 ， 即 使 最 好 的 


调试 技巧 也 会 失败 。 有 时 候 最 好 的 选择 是 回 退 ， 简 化 程序 ， 直 到 得 到 一 
个 你 能 够 理解 并 且 正 确 运 行 的 程序 。 





新 手 程序 员 往 往 不 愿意 后 撤 ， 他 们 无 法 忍受 删除 一 行 代 码 〈 即 使 那 
是 错误 的 代码 ) 。 如 果 能 让 你 感觉 更 好 ， 可 以 将 程序 复制 到 万 外 一 个 文 
件 再 开始 删 减 它 。 这 样 以 后 就 可 以 一 点 一 点 地 复制 回来 。 


寻找 一 个 困难 的 bug， 需 要 阅读 、 运 行 、 沉 思 ， 甚 至 有 时 候 需 要 回 
退 。 如 果 你 在 这 其 中 一 个 环节 上 卡 住 了 ， 可 以 尝试 其 他 的 环 市 。 


13.11 术语 表 


确定 性 〈deterministic) : 程序 的 一 种 特性 : 给 定 相 同 的 输入 ， 
次 运行 都 会 执行 相同 的 操作 。 


伪 随 机 Cpseudorandom) : 一 序列 数 : 看 起 来 是 随机 的 ， 但 实际 上 
是 由 带 着 确定 性 的 程序 生成 的 。 





默认 值 (default value) : 可 选 形 参 声 明 时 给 定 的 值 ， 如 果 函 数 调 
用 时 没有 指定 这 个 实 参 的 值 ， 则 使 用 该 默认 值 。 





fect (override) : 使 用 实 参 值 蔡 换 一 个 默认 值 。 


基准 测试 (benchmarking〉: 实现 不 同 的 备 选 方案 ， 并 使 用 各 种 可 
能 输入 的 样本 来 测试 它们 ， 以 达到 选择 使 用 哪 种 数据 结构 的 目的 。 


橡皮 鸭 调 试 (rubber duck debugging) : 通过 向 类 似 橡皮 网 之 类 的 
BO AAAS OREN Pale, ETT UIE. AR PARR SHIGA Python, (Hm 
诉说 和 解释 ， 可 以 帮助 你 解决 问题 。 


13.12 A 
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一 个 单词 的 “排名 ?是 它 在 单词 列表 中 按 频 率 排序 的 位 置 : 最 常见 的 
词 排名 第 1， 次 第 用 的 词 排 第 2?， 等 等 。 











齐 普 夫 定 律 〈Zipf's law) 描述 了 排名 和 自然 语言 中 词 频 的 关系 
(http://en.wikipedia.org/ wiki/Zipfs_law) 。 特 别 地 ， 它 预测 了 排名 为 r 
的 单词 的 频率 ff: 


f=cr s 


这 里 s 和 c 是 依赖 于 语言 和 文本 的 参数 。 如 果 在 表达 式 两 侧 都 调用 
对 数 ， 则 得 到 : 


log f=logc-slogr 


所 以 如 果 以 log r 为 横 轴 给 log f 绘图 ， 则 会 得 到 斜率 为 -=s , WEN 
loge 的 直线 。 


编写 一 个 程序 ， 从 文件 中 读 入 文本 ， 计 算 单 词 词 频 ， 并 按照 词 频 的 
降 夺 ， 每 一 行 打 印 出 一 个 单词 ， 以 及 log『 和 log r 。 使 用 你 喜欢 的 制图 
程序 将 结果 以 图 表 形 式 展现 出 来 ， 并 检查 它 是 人 否 为 直线 。 你 能 估计 s 的 
值 吗 ? 


过 
IX 
> 
ati 


解答 : http://thinkpython2.com/code/zipf.py。 要 运行 我 的 解 


要 安装 绘图 模块 matplot1ib 。 如 果 安 装 过 Anaconda， 你 就 已 经 有 了 
matplot1ib ， 人 否则 你 可 能 需要 安装 它 。 





第 14 章 ”文件 


本 章 介 绍 “ 持 久 ” 程 序 的 概念 ， 它 们 将 数据 存储 到 持久 存储 中 。 男 
外 ， 我 们 还 会 看 到 不 同 种 类 的 持久 存储 ， 如 文件 和 数据 库 。 


14.1 持久 化 


我 们 现在 见 过 的 程序 都 是 瞬 态 的 ， 因 为 它们 会 在 短暂 的 时 间 里 运行 
出 一 些 输出 ， 但 当 运 行 结束 后 ， 它 们 的 数据 会 消失 。 如 果 再 次 运行 程 
序 ， 它 会 再 次 全 新 地 开始 。 





也 有 些 程 序 是 持久 化 的 : 它们 会 运行 很 长 一 段 时 间 (或 者 一 直 运 
行 ); 它们 会 至 少 存储 一 部 分 数据 到 永久 存储 例如， 硬盘 〉 中; 而 且 
如 果 它 们 被 关闭 重 局 后 ， 会 接着 从 上 次 离开 的 状态 继续 。 








持久 化 程序 的 例子 包括 操作 系统 ， 它 几乎 运行 在 任何 一 台 开 局 的 电 
脑 中 ， 以 及 web 服 务 嚣 ， 它 们 通常 持续 运行 ， 等 得 网 络 上 连 入 的 请 求 。 











读 写 文本 文件 是 程序 维护 数据 最 简单 的 方法 之 一 。 我 们 已 经 见 过 读 
取 文本 文件 的 程序 ， 在 本 章 中 将 会 见 到 往 文件 写 入 的 程序 。 





为 一 种 办 法 是 将 程序 的 状态 保存 到 数据 库 中 。 本 半 中 我 们 会 介绍 一 
个 简单 的 数据 库 ， 以 及 一 个 模块 ，pickle ， 用 来 简化 程序 数据 的 存 
储 。 





14.2 读 和 写 





文本 文件 是 存储 在 诸如 硬盘 、 闪 存 或 光盘 的 永久 媒介 上 的 字符 串 序 
列 。 我 们 已 经 在 9.1 节 中 见 过 如 何 打 开 和 读 取 一 个 文件 。 


要 写 入 一 个 文件 ， 需 要 使 用 'w' 模式 作为 第 二 个 实 参 来 打开 它 : 


>>> fout = open('output.txt', 'w') 


MWMRLFCAFE, MEA SERAHAN S RE IHA A IF E 
开始 ， 所 以 请 谨慎 ! 如 果 文 件 不 存在 ， 则 会 新 建 一 个 。 


open 函数 返回 一 个 文件 对 象 ， 提 供 操 作文 件 的 方法 。 其 中 write 
方法 把 数据 写 入 到 文件 中 。 


>>> line1 = "This here's the wattle, \n" 
>>> fout.write(line1) 
24 





返回 值 是 写 入 的 字符 数目 。 文 件 对 象 会 记录 写 到 了 哪里 ， 所 以 如 果 
你 再 次 调用 write ， 它 会 在 文件 的 结尾 处 添加 新 的 数据 。 
>>> line2 = "the emblem of our land.\n" 


>>> fout.write(line2) 
24 





当 写 入 完毕 时 ， 应 该 关闭 文件 。 


>>> fout .close() 


如 傈 不 关闭 文件 ， 程 序 会 在 执行 结束 时 将 文件 关闭 。 


14.3 ”格式 操作 符 


write 的 参数 必须 是 字符 串 ， 所 以 大 我 们 想 要 往 文件 中 写 入 其 他 类 
型 的 值 ， 必 须 将 它们 先 转 换 为 字符 串 。 最 容易 的 办 法 是 使 用 str : 


>>> x = 52 
>>> fout.write(str(x)) 


另 一 个 办 法 是 使 用 格式 操作 符 % 。 当 用 于 整数 时 ，% 是 求 余 操 作 
从 。 但 耕 第 一 个 操作 对 象 是 字符 串 时 ，% 则 是 格式 操作 符 。 








% 的 第 一 个 操作 对 象 是 格式 字符 串 ， 包 括 了 一 个 或 多 个 格式 序列 
， 由 它们 来 指定 第 二 个 操作 对 象 如何 格 式 化 。 表 达 式 的 结果 是 一 个 字符 
串 。 





例如 ， 格 式 序列 '%d ' 意味 着 第 二 个 操作 数 应 该 被 格式 化 为 十 进 制 
整数 。 


>>> Camels = 42 
>>> '%d' % camels 
“42 





结果 是 字符 串 '42' ， 请 不 要 将 它 和 整数 值 42 混 消 。 


格式 序列 可 以 出 现在 字符 串 的 任意 地 方 ， 所 以 可 以 在 一 个 句子 中 插 
入 变量 值 ; 


>>> 'I have spotted %d camels.' % camels 
"I have spotted 42 camels.’ 





如 打字 符 串 中 有 多 于 一 个 格式 厅 列 ， 第 二 个 操作 对 象 束 必须 是 元 
组 。 每 个 格式 序列 按 顺 序 对 应 元 组 中 的 一 个 元 素 。 








下 和 面 的 例子 使 用 '%d' 格式 化 整数 ，'%g' 格式 化 浮 点 数 ， 以 及 '%s' 
格式 化 字符 串 : 


>>> "In %d years I have spotted %g %s.' % (3，6.1， ‘camels') 
"In 3 years I have spotted @.1 camels.' 





元 组 中 元 素 的 个 数 必须 和 字符 串 中 格式 序列 的 个 数 一 致 。 男 外 ， 元 
素 的 类 型 也 要 和 格式 序列 一 致 : 
>>> '%d %d %d' % (1, 2) 


TypeError: not enough arguments for format string 
>>> '%d' % ‘dollars’ 


TypeError: %d format: a number is required, not str 





第 一 个 例子 中 ， 元 组 中 元 素 个 数 不 够 ， 第 二 个 例子 中 ， 元 素 的 类 型 
不 对 。 


更 多 关于 格式 操作 符 的 信息 参见 
https://docs.python.org/3/library/stdtypes.html#printf-style- string- 
formatting. WA—S ERK SRA REST BRIE, Bl 
https://docs.python.org/3/library/stdtypes.html#str.format. 


14.4 文件 名 和 路 径 








文件 组 织 在 目录 《也 称 为 文件 夹 ) 中 。 每 个 程序 都 有 “当前 目录 ”， 
它 是 大 多 数 操作 的 默认 目录 。 例 如 ， 当 打开 一 个 文件 用 于 读 取 时 ， 
Python 默认 在 当前 目录 寻找 它 。 





os 模块 提供 了 用 于 操作 文件 和 目录 的 函数 〈os 代 表 operating 
system， 即 操作 系统 ) . os.getcwd 返回 当前 目录 的 名 称 : 
>>> import os 


>>> cwd = os.getcwd() 
>>> cwd 


"/home/dinsdale' 





cwd 表示 current working directory 〈 即 “当前 工作 目录 ”) 。 这 个 例子 
里 的 结果 是 /home/dinsdale ， 是 名 为 dinsdale 的 用 户 的 主 目录 。 





类 似 于 '/home/dinsdale' 这 样 用 来 定位 一 个 文件 或 目录 的 字符 串 
被 称 为 一 个 路 径 Cpath) 。 


而 一 个 简单 文件 名 ， 如 memo .txt ， 也 被 认为 是 一 个 路 径 ， 但 它 是 
一 个 相对 路 径 ， 因 为 它 依赖 于 当前 目录 。 如 果 当 前 目录 
是 /home/dinsdale ， 则 文件 名 memo .txt 指 的 


zz /home/dinsdale/memo.txt 。 


而 以 /开头 的 路 径 则 不 依赖 于 当前 目录 ， 上 所 以 被 称 为 绝对 路 径 
Cabsolute path) 。 可 以 使 用 os.path.abspath 来 找寻 文件 的 绝对 路 


>>> oS.path.abspath('memo.txt' ) 
"/home/dinsdale/memo.txt' 





os.path 还 提供 了 其 他 函数 来 操作 文件 名 和 路 径 。 例 
如 ，os.path.exists 检查 一 个 文件 或 目录 是 否 存在 : 








>>> oS.path.exists('memo.txt') 
True 





如 果 它 存在 ，os .path.isdir 可 以 检查 它 是 否 为 目录 : 





>>> oS.path.isdir('memo.txt' ) 

False 

>>> os.path.isdir('/home/dinsdale' ) 
True 





类 似 地 ，os.path.isfile 检查 它 是 否 为 文件 。 


os.listdir 返回 指定 目录 中 文件 (以 及 其 他 目录 〉 的 列表 : 





>>> os.listdir(cwd) 
['music', 'photos', 'memo.txt' ] 





为 了 演示 这 些 图 数 ， 下 面 的 例子 “ 走 裔 ?一 个 目录 ， 打 印 所 有 文件 的 
名 称 ， 并 对 之 中 的 子 目 录 递 归 调 用 自己 。 


def walk(dirname): 
for name in os.listdir(dirname): 
path = os.path.join(dirname, name) 


if os.path.isfile(path): 
print(path) 

else: 
walk(path) 





os.path. join 接收 一 个 目录 和 一 个 文件 名 称 ， 并 将 它们 拼接 为 一 
个 完整 的 路 径 。 


os 模块 提供 了 一 个 函数 walk ， 和 上 面 的 例子 作用 类 似 ， 但 功能 
丰富 。 作 为 练习 ， 请 阅读 文档 ， 并 使 用 它 打印 指定 目录 中 文件 的 名 称 和 


它 的 子 目录 。 你 可 以 从 http://thinkpython2.com/code/walk.py 下 载 我 的 解 
从 








145 ”捕获 异常 








当 和 葡 试 读 取 和 写 入 文件 时 ， 很 多 东西 都 可 能 出 错 。 如 果 答 试 打开 一 
AE S 2)—P10Error : 


>>> fin = open('bad_file') 
IOError: [Errno 2] No such file or directory: ‘bad_file' 





如 果 没 有 权限 访问 一 个 文件 : 


>>> fout = open('/etc/passwd', 'w') 
PermissionError: [Errno 13] Permission denied: '/etc/passwd' 





如 果 答 试 打 开 一 个 目录 用 于 文件 恋 取 ， 会 得 到 


>>> fin = open('/home') 
IsADirectoryError: [Errno 21] Is a directory: '/home' 





要 避免 这 些 错 误 ， 可 以 使 用 类 似 os .path.exists 和 








os.path.isfile 的 函数 ， 但 要 检查 所 有 的 可 能 需要 花费 大 量 时 间 和 代 
1 (“Errno 212” 这 个 名 字 ， 说 明 至 少 有 21 种 可 能 出 错 的 地 方 ) 。 


最 好 是 直接 去 尝试 一 一 等 发 生 问 题 时 再 去 解决 它们 一 一 这 也 正 
是 try 语句 所 做 的 事情 。 语 法 和 if...else 语句 类 似 : 





try: 
fin = open('bad file’) 


except: 
print (‘Something went wrong. ') 


Python 会 先 从 try 子 句 开始 ， 如 果 一 切 顺利 ， 则 跳 过 except 语句 
并 继续 执行 。 如 果 发 生 了 异常 ， 则 跳出 try 子 句 ， 并 运行 except T 
fjs 





使 用 try EEEE E ER ATR 一 个 寞 第 。 在 这 个 例子 
Æ, except 语句 打印 的 错误 信息 并 没有 太 多 用 处 。 总 的 来 说 ， 捕 获 姑 
常 给 了 你 一 个 修补 错误 的 机 会 ， 或 者 可 以 再 次 尝试 ， 或 者 至 少 能 够 优雅 
地 停止 程序 。 





14.6 ”数据 库 


数据 库 是 一 个 有 组 织 的 用 于 存储 数据 的 文件 。 许 多 数据 库 都 像 字 
典 一 样 组 织 数据 ， 因 为 它们 也 将 键 映 财 到 值 上 。 数 据 库 和 字典 之 间 最 大 
的 区 别 是 数据 库 是 保存 在 磁盘 上 《或 者 其 他 永久 存储 上 ) 的 ， 所 以 当 程 
序 结束 时 它 也 能 持续 存在 。 











模块 dbm 提供 了 接口 用 于 创建 和 更 新 数据 库 文件 。 作 为 示例 ， 我 将 
会 创建 一 个 数据 库 保存 图 片 文件 的 标题 。 


打开 一 个 数据 库 和 打开 其 他 类 型 的 文件 差不多 : 


>>> import dbm 
>>> db = dbm.open('captions', 'c') 


模式 'c' 意味 厦 数据 库 应 当 被 创建 ， 如 果 它 不 存在 的 话 。 调 用 的 结 
打 是 一 个 数据 库 对 象 ，《〈 对 大 多 数 操作 ) 可 以 当 作 字典 来 用 。 


当 创 建 一 个 新 项 时 ，dbm 会 更 新 数据 库 文件 。 


>>> db['cleese.png'] = 'Photo of John Cleese.， 


当 访 问 数据 库 中 的 一 项 时 ，dbm 会 读 取 文 件 : 


>>> db['cleese.png' ] 
b'Photo of John Cleese.' 


这 里 的 结果 是 一 个 字 节 组 对 象 (bytes object) ， 因 此 以 b 开头 。 字 
节 组 对 象 和 字符 串 很 类 似 。 当 你 更 加 深入 研究 Python 的 时 候 ， 它 们 的 区 
别 可 能 会 变 得 很 重要 ， 但 现在 可 以 忽略 。 











如 果 对 一 个 已 经 存在 的 键 赋值 ，dbm 22 IHE: 


>>> db['cleese.png'] = 'Photo of John Cleese doing a silly walk. ' 
>>> db['cleese.png' ] 


b'Photo of John Cleese doing a silly walk.’ 





有 一 些 字 典 方法 ， 如 keys 和 items ， 对 数据 库 对 象 不 可 以 使 用 。 
但 使 用 for 循环 来 迭代 遍历 是 可 以 的 : 


for key in db: 
print(key, db[key]) 








和 其 他 文件 一 样 ， 当 操作 结束 时 ， 需 要 关闭 数据 库 : 


>>> db.close() 


147 F 


dbm 的 限制 之 一 是 键 和 值 都 必须 是 字符 串 或 字 节 。 如 果 答 试 使 用 其 
他 类 型 ， 则 会 出 现 错误 。 


pickle 模块 可 以 帮忙 。 它 可 以 将 几乎 所 有 类 型 的 对 象 转换 为 适合 
保存 到 数据 库 的 字符 串 形 式 ， 并 可 以 将 字符 串 转 换 回 来 成 为 对 象 。 


pickle.dumps 接收 一 个 对 象 作为 参数 ， 并 返回 它 的 字符 串 表 达 形 
式 (dumps 是 “dump string” 的 简写 ， 意 即 转 储 字 符 串 ) : 


>>> import pickle 
>>> t = [1, 2, 3] 
>>> pickle.dumps(t) 


b ' \x80\x03 ]q\x@0(K\x@1K\x@2K\x@3e. ' 





这 个 格式 不 适合 人 眼 阅 读 ， 它 是 为 了 方便 pickle 模块 的 转换 而 设 
计 的 。pickle.1loads (load string， 即 加 载 字 符 串 ) 重新 构造 对 象 : 


>>> t1 = [1, 2, 3] 

>>> Ss = pickle.dumps(t1) 
>>> t2 = pickle.loads(s) 
>>> t2 


[1, 2, 3] 





虽然 新 的 对 象 和 旧 有 对 象 的 值 相同 ， 但 《〈 通 第 来 说 ) 它们 不 是 同一 
个 对 象 : 


>>> t1 == t2 


True 
>>> t1 is 七 2 
False 





也 就 是 说 ， 封 存 再 解 封 ， 和 复制 对 象 效果 相同 。 


你 可 以 使 用 pickle 回 数 据 库 存储 非 字 符 串 的 值 。 事 实 上 ， 这 个 组 
合 如 此 铝 用 ， 以 至 于 Python 已 经 将 它们 封装 起 来 成 为 一 个 模块 ， 叫 
作 shelve 。 


14.8 is 


大 部 分 操作 系统 都 提供 了 命令 行 接口 ， 也 称 为 字符 界面 
(shell) 。 字 符 界 面 通 音 会 提供 命令 来 浏览 文件 系统 和 局 动 应 用 程序 。 
例如 ， 在 Unix 中 ， 可 以 使 用 cd 来 更 换 目 录 ， 使 用 1s 来 展示 目录 中 的 内 
容 ， 以 及 打 入 firefox 来 启动 浏览 器 


任何 在 字符 界面 能 启动 的 程序 都 可 以 在 Python 中 使 用 管道 对 象 
(pipe object) 来 启动 。 管 道 对 象 代表 一 个 正在 运行 的 程序 。 








例如 ，Unix 命 令 1s -1 以 长 格式 展示 当前 目录 的 内 容 。 可 以 使 
用 os . popen 上 古来 启动 1s : 


>>> cmd = ‘Is -1 
>>> fp = os.popen(cmd) 


参数 是 一 个 字符 串 ， 它 包含 一 个 shel 命 令 。 返 回 值 是 一 个 和 打开 的 
文件 差不多 的 对 象 。 可 以 使 用 readline 来 逐 行 读 取 ls 进程 的 输出 ， 或 
者 使 用 read 一 次 读 取 所 有 输出 : 


>>> res = fp.read() 


当 你 完成 时 ， 可 以 像 文件 一 样 关 闭 这 个 管道 





>>> stat = fp.close() 
>>> print(stat) 
None 


pO 


返回 值 是 1s 进程 的 最 终 状 态 ; None 代表 它 正 常 结束 了 没有 错 
误 ) 。 


例如 ， 大 部 分 Unix 系 统 都 提供 了 一 个 叫 作 md5sum 的 命令 ， 它 读 取 
文件 的 内 容 并 计算 出 一 个 “ 校 验 和 ”(checksum) 。 你 可 以 在 
http://en.wikipedia.org/wiki/JMd5 阅 读 MD5 的 相关 信息 。 这 个 命令 提供 了 
一 个 高 效 的 方法 ， 用 来 对 比 两 个 文件 是 否 包含 相同 的 内 容 。 不 同 的 内 容 
生成 相同 的 校 验 和 的 概率 极 低 〈( 也 就 是 ， 在 宇宙 月 尝 之 前 不 大 可 能 发 
生 ) 。 





可 以 在 Python 中 使 用 管道 来 运行 nd5sum ， 并 获得 结果 : 


>>> filename = 'book.tex' 

>>> cmd = 'mdSsum ' + filename 
>>> fp = os.popen(cmd) 

>>> res = fp.read() 

>>> stat = fp.close() 


>>> print res 
1e0033f0ed0656636de0d75144ba32e0 book.tex 
>>> print(stat) 

None 





14.9 ”编写 模块 


任何 包 仿 Python 代码 的 文件 都 可 以 作为 模块 导入 。 例 如 ， 如 果 你 有 
一 个 文件 wc .py ， 其 代码 如 下 : 


def linecount(filename): 
count = @ 
for line in open(filename): 
count += 1 


return count 


print(linecount('wc.py')) 





如 琳 你 运行 这 个 程序 ， 它 会 读 取 上 自身 的 内 容 ， 并 打印 出 文件 的 行 
数 ， 即 7。 你 也 可 以 像 这 样 导入 它 : 


>>> import wc 
7 


现在 你 有 一 个 模块 对 象 wc T: 


>>> wc 
<module 'wc' from 'wc.py'> 





该 模块 对 象 提供 了 1inecount : 





>>> wc.linecount('wc.py' ) 
7 


上 述 就 是 在 Python 中 编写 模块 的 方法 。 


这 个 例子 唯一 的 问题 是 当 你 导入 模块 时 ， 它 会 运行 底部 的 测试 代 
码 。 正 常情 况 下 ， 当 你 导入 一 个 模块 时 ， 它 会 定义 新 的 函数 ， 但 不 会 运 
IT: 


作为 模块 导入 的 程序 ， 通 常 使 用 如 下 模式 : 


if name == '  _main 


print(linecount(‘wc.py')) 





_name 是 一 个 内 置 变量 ， 当 程序 启动 时 就 会 被 设置 。 如 果 程序 
作为 脚本 执行 ，_name ”的 值 是 ， main _，;， 此 时 ， 测 试 代码 会 被 
运行 。 和 否则， 如 果 程 序 作为 模块 被 导入 ， 则 测试 代码 就 被 跳 过 了 。 





作为 练习 ， 把 这 个 例子 输入 到 一 个 文件 wc.py 中 ， 并 将 它 作 为 一 个 
脚本 运行 。 然 后 运行 Python 解释 器 ， 并 导入 wc 。 当 模块 被 导入 
时 ， name _ 的 值 是 什么 ? 


警告 如果 你 导入 一 个 已 经 被 导入 的 模块 ，Python 什 么 都 不 做 。 它 
不 会 重新 读 取 文 件 ， 即 使 文件 已 经 修改 。 


如 果 你 想 要 重 载 一 个 模块 ， 可 以 使 用 内 置 函数 reload ， 但 它 也 可 
能 会 有 琼 手 的 问题 。 所 以 最 安全 的 办 法 是 重启 解释 器 ， 并 再 次 导入 模 
块 。 


14.10 ”调试 


当 你 读 取 和 写 入 文件 时 ， 可 能 会 遇 到 和 空白 字符 相关 的 问题 。 这 些 
问题 可 能 会 很 难 调试 ， 因 为 空格 、 制 表 符 和 换行 符 通常 都 是 不 可 见 的 : 


>>> S = '1 2\t 3\n 4' 
>>> print(s) 
1 2 3 


4 





内 置 函数 repr 可 以 帮忙 。 它 接收 任何 对 象 作为 参数 ， 并 返回 对 象 
的 字符 串 表 达 形式 。 对 于 字符 串 来 说 ， 它 使 用 反 斜 杠 序列 来 展示 空白 字 
符 : 


>>> print (repr(s)) 
"1 2\t 3\n 4' 


这 样 可 以 帮助 调试 。 








另 一 个 你 可 能 遇 到 的 问题 是 不 同 的 系统 使 用 不 同 的 字符 表示 换行 。 
有 的 系统 使 用 一 个 换行 符 ， 即 \n 。 另 外 的 系统 使 用 一 个 回 车 符 ， 即 \r 
。 也 有 的 系统 两 者 都 使 用 。 如 果 你 在 不 同 的 系统 间 移 动 文件 ， 这 些 不 一 
致 之 处 可 能 会 导致 问题 。 


大 多 数 系 统 都 有 程序 可 以 将 一 种 格式 转换 为 另 一 种 。 你 可 以 在 
http://en.wikipedia.org/wiki/ Newline 找 到 它们 (并 阅读 这 个 问题 的 更 多 信 
E) o RE: SAR, 你 也 可 以 目 己 写 一 个 。 


14.11 NEK 


持久 性 (persistent) : 程序 的 一 种 属性 ， 它 会 一 直 运 行 ， 并 至少 保 
存 一 部 分 数据 在 永久 存储 中 。 

格式 操作 符 (format operator) : 一 个 操作 符 ， 即 % ， 它 接收 一 个 
格式 字符 串 ， 以 及 一 个 元 组 ， 并 生成 字符 串 ， 其 中 包括 了 元 组 的 各 个 依 
据 格式 字符 串 里 指定 的 方式 格式 化 的 元 素 。 





格式 字符 串 (format string) : 一 个 字符 串 ， 被 格式 操作 符 所 用 ， 
内 部 包含 格式 序列 。 


Po AY 


格式 序列 (format sequence) : 格式 字符 串 中 出 现 的 字符 序列 ， 
如 %d ， 它 指定 一 个 值 如 何 格式 化 。 


文本 文件 (text file) : 存储 在 类 似 人 硬盘 这 样 的 永久 存储 中 的 字符 
PFJ 


目录 (directory) : 有 名 称 的 文件 集合 。 也 称 为 文件 夹 。 

BRE 〈path) : 用 来 标定 一 个 文件 的 字符 串 。 

相对 路 径 (relative path) : 从 当前 目录 开始 的 路 径 。 

绝对 路 径 (absolute path) : 从 文件 系统 的 顶级 目录 开始 的 路 径 。 


捕获 (catch) : 使 用 try 和 except 语句 来 阻止 一 个 异常 终止 程序 


数据 库 (database) : 一 个 文件 ， 其 内 容 组 织 类 似 于 字典 ， 将 键 映 
射 到 值 。 


组 对 象 (bytes object) : 一 个 和 字符 串 相 似 的 对 象 。 


命令 行 (shell) : 一 个 程序 ， 人 允许 用 户 键入 命令 并 通过 调用 其 他 程 
序 来 执行 这 些 命令 。 


管道 对 象 (pipe object) : 代表 一 个 运行 中 的 程序 的 对 象 ， 
Python 程序 可 以 运行 命令 并 读 取 结 果 。 





14.12 练习 
练习 14-1 


写 一 个 名 为 sed 的 函数 ， 接 收 如 下 参数 : 一 个 模式 字符 串 ， 一 个 蔡 
换 用 字符 串 ， 以 及 两 个 文件 名 。 它 应 该 读 取 第 一 个 文件 ， 并 将 内 容 写 入 
第 二 个 文件 (如 果 需 要 则 新 建 它 ) 。 如 果 文 件 中 任何 地 方 出 现 了 模式 字 
符 串 ， 应 该 蔡 换 掉 。 


如 果 在 打开 、 读 取 、 写 入 或 关闭 文件 的 过 程 中 遇 到 错误 ， 你 的 程序 
应 当 能 捕获 异常 ， 打 印 一 个 错误 信息 ， 并 退出 。 

解答 : http://thinkpython2.com/code/sed.py。 

练习 14-2 


如 果 你 从 http://thinkpython2.com/code/anagram_sets.py 下 载 我 对 练习 
12-2 的 解答 ， 你 会 发 现 它 创 建 一 个 字典 ， 将 一 个 排 好 序 的 字母 串 映射 到 
可 以 由 这 些 字 母 组 成 的 单词 的 列表 。 例 如 ， "opst ' 映射 到 
['opts', 'post', 'pots', 'spot', 'stop', 'tops'] 列表 。 


编写 一 个 模块 ， 导 入 anagram_sets ， 并 提供 两 个 新 函 
数 : store_anagrams 应 当 存 储 回 文字 典 到 一 
个 “shelf” 中 ; read_anagrams 应 当 碍 询 一 个 单词 ， 并 返回 它 的 回 文 的 
列表 。 


解答 : http://thinkpython2.com/code/anagram_db.py。 


练习 14-3 








和 一 个 庞大 的 MP3 文 件 的 集合 中 ， 有 可 能 同一 首 歌 有 多 个 副本 ， 保 
存在 不 同 的 目录 中 ， 或 者 文件 名 不 同 。 这 个 练习 的 目的 是 搜索 重复 的 














1. 编写 一 个 程序 递归 搜索 目录 及 其 所 有 的 子 目 录 ， 并 返回 所 有 指 
EA 〈 如 .mp3 ) 的 文件 的 完整 路 径 的 列表 。 提 示 : os .path 提供 了 
几 个 有 用 的 方法 来 操纵 文件 和 路 径 名 称 。 


2. 要 发 现 重 复 文 件 ， 需 要 使 用 md5sum 来 计算 每 个 文件 的 “ 校 验 
和 ”。 如 果 两 个 文件 的 校 验 和 相同 ， 它 们 很 可 能 有 相同 的 内 容 。 


3. 你 可 以 使 用 Unix 命 令 diff 来 复审 检验 。 


解答 : http://thinkpython2.com/code/find_duplicates.py 





[1] popen 现在 已 经 计划 废止 了 ， 也 融 是 说 我 们 应 当 不 再 使 用 它 ， 而 是 开 
始 使 用 subprocess 模块 。 但 对 于 简单 的 情形 ， 我 发 现 sSupprocess 过 
度 复 杂 了 。 所 以 我 仍然 继续 使 用 popen ， 直 到 它 被 完全 废止 。 


第 15 章 ”类 和 对 象 


到 现在 你 已 经 知道 如 何 使 用 函数 来 组 织 代码 ， 以 及 如 何 用 内 置 类 型 
来 组 织 数据 。 下 一 步 将 学 习 “ 面 癌 对 象 编程 >， 面 问 对 象 编 程 使 用 目 定义 
的 类 型 同时 组 织 代码 和 数据 。 面 向 对 象 编程 是 一 个 很 大 的 话题 


题 ， 需 要 好 
几 章 来 讨论 。 





本 章 的 代码 示例 可 以 从 http:Wthinkpython2.com/code/Point1.py 下 载 ， 
练习 的 解答 可 以 在 http://thinkpython2.com/code/Point1_soln.py 下 载 。 


15.1 用 户 定义 类 型 


我 们 已 经 使 用 了 很 多 Python 的 内 置 类 型 ， 现 在 我 们 要 定义 一 个 新 类 
型 。 作 为 示例 ， 我 们 将 会 新 建 一 个 类 型 point ， 用 来 表示 二 维 空间 中 的 


INNY 








FERS NAANIS +, RUE ETE S E or NAER. Bil 
如 ，(0, 0) 表 示 原 点 ， 而 (x,y ) 表 示 一 个 在 原点 右 侧 x 单位 ， 上 方 y 单位 的 


Wyo 


在 Python 中 ， 有 好 几 种 方法 可 以 表达 点 。 


。 我 们 可 以 将 两 个 坐标 分 别 保存 到 变量 x 和 y 中 。 
。 我 们 可 以 将 坐标 作为 列表 或 元 组 的 元 聚 存储 。 
。 我 们 可 以 新 建 一 个 类 型 用 对 象 表达 点 。 


新 建 一 个 类 型 比 其 他 方法 更 复杂 一 些 ， 但 它 的 优点 很 快 就 会 显现 出 
来 。 


用 户 定 义 的 类 型 也 称 为 类 class) 。 类 的 定义 如 下 所 示 : 


class Point: 
"""Represents a point in 2-D space.""" 





定义 头 表 示 新 的 类 名 为 Point 。 定 义 体 是 一 个 文档 字符 串 ， 解 释 这 
个 类 的 用 途 。 可 以 在 类 定义 中 定义 变量 和 函数 ， 我 们 会 在 后 面 回 到 这 个 





话题 。 
定义 一 个 叫 作 Point 的 类 会 创建 一 个 对 象 类 (object class) 。 


>>> Point 
<class ' main .Point'> 


因为 Point 是 在 程序 顶层 定义 的 ， 它 的 “全 名 ”是 _ main __.Point 


类 对 象 像 一 个 创建 对 象 的 工厂 。 要 新 建 一 个 Point 对 象 ， 可 以 把 
Point 当 作 函数 来 调用 : 


>>> blank = Point() 
>>> blank 


<_ main .Point object at @xb7e9d3ac> 





返回 值 是 到 一 个 Point 对 象 的 引用 ， 我 们 将 它 赋值 给 变量 blank 。 


新 建 一 个 对 象 的 过 程 称 为 实例 化 〈instantiation) ， 而 对 象 是 这 个 
类 的 一 个 实例 。 


在 打印 一 个 实例 时 ，Python 会 告诉 你 它 所 属 的 类 型 ， 以 及 存储 在 内 
存 中 的 位 置 “前 绥 8x 表示 后 面 的 数字 是 十 六 进 制 的 ) 。 





每 个 对 象 都 是 茶 个 类 的 实例 ， 所 以 “对 象 "? 和 "实例 ”这 两 个 词 很 多 情 
况 下 都 可 以 互 换 。 但 是 ， 在 本 章 中 我 使 用 “实例 ”来 表示 一 个 目 定 义 类 型 
的 对 象 。 











15.2 属性 


可 以 使 用 句点 表示 法 来 给 实例 赋值 : 


>>> blank. 
>>> blank. 


< x 
toil 
Rw 
oo 


这 个 语法 和 从 模块 中 选择 变量 的 语法 类 似 ， 如 math .pi 或 
者 string.whitespace 。 但 在 这 种 情况 下 ， 我 们 是 将 值 赋 给 一 个 对 象 
的 有 命名 的 元 素 。 这 些 元 素 称 为 属性 (attribute) 。 








作为 名 词 时 ，“AT-trib-ute” 发 音 的 重音 在 第 一 个 音节 ， 这 与 作为 动 
词 的 “a-TRIB-ute” 不 同 。 





下面 的 图 表 展 示 了 这 些 赋值 的 结果 。 展 示 一 个 对 象 和 其 属性 的 状态 
图 称 为 对 象 图 (object diagram) ， 参 见 图 15-1。 


Point 
blank x — > 3.0 
y — > 40 

图 15-1 对 象 图 


变量 blank 引用 癌 一 个 Point 对 象 ， 它 包含 了 两 个 属性 。 每 个 属性 引 
AME A 


可 以 使 用 相同 的 语法 来 读 取 一 个 属性 的 值 : 


>>> blank.y 
4.0 
>>> x = blank.x 


>>> X 
3.0 





表达 式 blank.x KIK, “找到 blank 引用 的 对 象 ， 并 取得 它 的 x 属 
性 的 值 ”。 在 这 个 例子 中 ， 我 们 将 那个 值 赋值 给 一 个 变量 x 。 变 量 x 和 属 
性 x 并 不 冲突 。 





可 以 在 任意 表达 式 中 使 用 句点 表示 法 。 例 如 : 


>>> '(%g, %g)' % (blank.x, blank.y) 

'(3.0, 4.0)' 

>>> distance = math.sqrt(blank.x**2 + blank.y**2) 
>>> distance 

5.0 








BY BRR “SSE BIE A SEB HG E IA AR. BH: 


def print_point(p): 
print('(%g, %g)' % (p.x, p-y)) 








print_point 接收 一 个 点 作为 形 参 ， 并 按照 数学 表达 式 展 示 它 。 
可 以 传 入 blank 作为 实 参 来 调用 它 : 


>>> print_point(blank) 
(3.0, 4.0) 





在 函数 中 ，p 是 blank 的 一 个 别名 ， 所 以 如 果 函 数 修改 了 p ， 
则 blank 也 会 改变 。 


作为 练习 ， 编 写 一 个 叫 作 distance_between_points 的 函数 ， 接 
收 两 个 Point 对 象 作 为 形 参 ， 并 返回 它们 之 间 的 距离 。 


15.3 ”定形 





有 了 时候 对 象 应 该 有 哪些 属性 非常 明显 ， 但 也 有 了 时候 需 要 你 来 做 决 
定 。 例 如 ， 假 设 你 在 设计 一 个 表达 和 窍 形 的 类 。 你 会 用 什么 属性 来 指定 一 
MERI M ASME? 可 以 忽略 角度 ， 为 了 简单 起 见 ， 假 定 矩 形 不 是 
EA IEK F. 





最 少 有 以 下 两 种 可 能 。 


。 可 以 指定 一 个 矩形 的 一 个 角落 《或 者 中 心 点 ) 、 宽 度 以 及 高 度 。 
。 可 以 指定 两 个 相对 的 角落 。 


现在 还 很 难说 哪 一 种 方案 更 好 ， 所 以 作为 示例 ， 我 们 仅 移 实现 第 一 


ays 


下 面 是 这 个 类 的 定义 : 


class Rectangle: 
nun Represents a rectangle . 


attributes: width, height, corner. 





文档 字符 串 列 出 了 属性 : width 和 height 是 数字 ; corner 是 一 个 
Point 对 象 ， 用 来 指定 左下 角 的 顶点 。 


要 表达 一 个 矩形 ， 需 要 实例 化 一 个 Rectangle 对 象 ， 并 对 其 属性 赋 
值 : 


box = Rectangle() 
box.width = 100.0 
box.height = 200.0 
box.corner = Point() 


box.corner.x = 0.0 
box.corner.y = 0.0 





表达 式 box.corner.x RIR, “去 往 box 引用 的 对 象 ， 并 选择 属 
性 corner ; 接着 去 往 那 个 对 象 ， 并 选择 属性 x ”。 





图 15-2 展 示 了 这 个 对 象 的 状态 。 作 为 另 一 个 对 象 的 属性 存在 的 对 象 
HEALER 的 。 


Rectangle 


height —> 200.0] = gg 
corner y 0.0 





图 15-2 WAKI 


15.4 作为 返回 值 的 实例 


agian 例如 ，find_center 接收 Rectangle X RIE 
为 参数 ， 并 返回 一 个 Point 对 象 ， 包 含 这 个 Rectangle MA AAA 


标 : 


def find center(rect): 
p = Point() 
p.X = rect.corner.x + rect.width/2 


p.y = rect.corner.y + rect.height/2 
return p 





下 面 是 一 个 示例 ， 传 入 box 作为 实 参 ， 并 将 结果 的 Point 对 象 赋 给 变 


awh" 
center: 


>>> center = find_center (box) 
>>> print_point(center) 


(50, 100) 





15.5 “对象 是 可 变 的 


可 以 通过 给 一 个 对 象 的 某 个 属性 赋值 来 修改 它 的 状态 。 例 如 ， 要 修 
改 一 个 矩形 的 尺寸 而 保持 它 的 位 置 不 变 ， 可 以 修改 属性 width 和 
height 的 值 : 


box.width = box.width + 50 
box.height = box.height + 100 





也 可 以 编写 函数 来 修改 对 象 。 例 如 ，grow_rectangle 接收 一 个 
Rectangle 对 象 和 两 个 数 ，dwidth 和 dheight ， 并 把 这 些 数 加 到 和 矩形 的 


EME: 


def grow_rectangle(rect, dwidth, dheight): 
rect.width += dwidth 
rect.height += dheight 





下 面 是 展示 这 个 函数 效果 的 示例 : 


>>> box.width, box.height 
(150.0, 300.0) 
>>> grow_rectangle(box, 50, 100) 


>>> box.width, box.height 
(200.0, 400.0) 





在 函数 中 ，rect 是 box 的 别名 ， 所 以 如 果 当 修改 了 rect IN, box 
也 改变 。 


作为 练习 ， 编 写 一 个 名 为 move_rectangle 的 函数 ， 接 收 一 个 
Rectangle 对 象 和 两 个 分 别名 为 dx 和 dy 的 数值 。 它 应 当 通 过 将 dx 添加 
到 corner 的 x 坐标 和 将 dy 添加 到 corner 的 y 坐标 来 改变 矩形 的 位 置 。 


15.6 iil 





别名 的 使 用 有 时 候 会 让 程序 更 难 阅读 ， 因 为 一 个 地 方 的 修改 可 能 会 
给 其 他 地 方 带 来 意 想不到 的 变化 。 要 跟踪 掌握 所 有 引用 到 一 个 给 定 对 象 
的 变量 非常 困难 。 








使 用 别名 的 常用 蔡 代 方案 是 复制 对 象 。copy 模块 里 有 一 个 函 
数 copy 可 以 复制 任何 对 象 : 


>>> p1 = Point() 
>>> pl.x = 3.0 
>>> pl.y = 4.0 


>>> import copy 
>>> p2 = copy.copy(p1) 





p1 和 p2 包含 相同 的 数据 ， 但 是 它们 不 是 同一 个 Point 对 象 。 


>>> print_point(p1) 
(3, 4) 

>>> print_point(p2) 
(3, 4) 

>>> p1 is p2 


False 
>>> p1 == p2 
False 





正如 我 们 预料 ，is 操作 符 告诉 我 们 pl 和 p2 不 是 同一 个 对 象 。 但 你 
可 能 会 预料 == 能 得 到 True 值 ， 因 为 这 两 个 点 包 含 相同 的 数据 。 如 果 那 
样 ， 你 会 失望 地 发 现 对 于 实例 来 说 ，== 操作 符 的 默认 行为 和 is 操作 符 


相同 ， 它 会 检查 对 象 同一 性 ， 而 不 是 对 象 相等 性 。 这 是 因为 对 于 用 户 自 
定义 类 型 ，Python 并 不 知道 怎么 才 算 相等 。 至 少 现在 还 不 行 。 





如 果 使 用 copy . copy 复制 一 个 Rectangle， 你 会 发 现 它 复制 了 
Rectangle 对 象 但 并 不 复制 内 磐 的 Point 对 象 : 





>>> box2 = copy.copy(box) 
>>> box2 is box 
False 


>>> box2.corner is box.corner 
True 





15-3) AN S XARRI AR. SERVE PK AIR tii] (shallow 
copy) ， 因 为 它 复制 对 象 及 其 包含 的 任何 引用 ， 但 不 复制 内 峙 对 象 。 





box width —> 100.0 100.0<— width |jx—box2 
height —> 200.0 200.0<— height 


corner corner 


图 15-3 WHAKI 





对 于 大 多 数 应 用 ， 这 并 不 是 你 所 想 要 的 。 在 这 个 例子 里 ， 对 一 个 
Rectangle 对 象 调用 grow_rectangle 并 不 会 影响 其 他 对 象 ， 但 对 任何 一 
个 Rectangle 对 象 调 用 move_rectangle 都 会 影响 全 部 两 个 对 象 ! 这 种 行 
为 既 混 乱 不 清 ， 又 容易 导致 错误 。 


幸好 ，copy 模块 还 提供 了 一 个 名 为 deepcopy 的 方法 ， 它 不 但 复制 
对 象 ， 还 会 复制 对 象 中 引用 的 对 象 ， 甚 至 它们 引用 的 对 象 ， 依 次 类 
推 。 所 以 你 并 不 会 惊讶 这 个 操作 为 何 称 为 深 复 制 (deep copy) 。 


>>> box3 = copy.deepcopy(box) 
>>> box3 is box 
False 


>>> box3.corner is box.corner 
False 





box3 和 box 是 两 个 完全 分 开 的 对 象 。 


作为 练习 ， 编 写 move_rectangle 的 男 一 个 版 本 ， 它 会 新 建 并 返回 
一 个 Rectangle 对 象 ， 而 不 是 直接 修改 旧 对 象 。 





15.7 调试 


开始 操作 对 象 时 ， 可 能 会 遇 到 一 些 新 的 异常 。 如 果 试 图 访问 一 个 并 
不 存在 的 属性 ， 会 得 到 AttributeError : 


>>> 
>>> 
>>> 


>>> p. 
AttributeError: Point instance has no attribute 'z' 





如 果 不 清楚 一 个 对 象 是 什么 类 型 ， 可 以 问 : 


>>> type(p) 
<class '_ _main_ _.Point'> 











也 可 以 使 用 isinstance 来 检查 对 象 是 否 是 某 个 类 的 实例 : 





>>> isinstance(p, Point) 
True 





如 果 不 确 定 一 个 对 象 是 否 拥有 某 个 特定 的 属性 ， 可 以 使 用 内 置 函 
数 hasattr : 





>>> hasattr(p, 'x') 
True 

>>> hasattr(p, 'z') 
False 


第 一 个 形 参 可 以 是 任何 对 象 ， 第 二 个 形 参 是 一 个 包含 属性 名 称 的 字 


也 可 以 使 用 try 语句 来 尝试 对 象 是 否 拥有 你 需要 的 属性 : 


x= p.x 
except AttributeError: 


xX = 0 





这 种 方法 可 以 使 编写 适用 于 不 同类 型 的 函数 更 加 容易 。 关 于 这 一 主 
题 的 更 多 内 容 参见 17.9 节 。 


15.8 NEK 
类 (class) : 一 个 用 户 定 义 的 类 型 。 类 定义 会 新 建 一 个 类 对 象 。 


类 对 象 (class object) : 一 个 包含 用 户 定 义 类 型 的 信息 的 对 象 。 类 
对 象 可 以 用 来 创建 该 类 型 的 实例 。 


实例 Cinstance) : 属于 茶 个 类 的 一 个 对 象 。 

实例 化 Cinstanciate) : 创建 一 个 新 对 象 。 

属性 (attribute〉: 一 个 对 象 中 关联 的 有 命名 的 值 。 

ARIZ (embedded object) : 作为 一 个 对 象 的 属性 存储 的 对 象 。 


eZ till (shallow copy) : 复制 对 象 的 内 容 ， 包 括 内 散 对 象 的 引 
FA; copy 模块 中 的 copy 函数 实现 了 这 个 功能 。 


深 复 制 (deep copy) : 复制 对 象 的 内 容 ， 也 包括 内 骨 对 象 ， 以 及 
CIARN ZR, KRŽE: copy 模块 中 的 deepcopy 函数 实现 了 这 个 
功能 。 


对 象 图 (object diagram) : 一 个 展示 对 象 、 对 象 的 属性 以 及 属性 
的 值 的 图 。 


159 练习 


24 5415-1 


定义 一 个 新 的 名 为 Circle 的 类 表示 圆 形 ， 它 的 属性 有 center 和 


radius ， 其 中 center 是 一 个 Point 对 象 ， 而 radius 是 一 个 数 。 





实例 化 一 个 Circle 对 象 来 代表 一 个 圆心 在 (150, 100)、 半 径 为 75 的 圆 
Fa 


编写 一 个 函数 point_in_ circle ， 接 收 一 个 Circle 对 象 和 一 个 Point 


对 象 ， 并 当 Point 处 于 Circle 的 边界 或 其 内 时 返回 True 。 


编写 一 个 函数 rect_in_circle ， 接 收 一 个 Circle 对 象 和 一 个 
Rectangle 对 象 ， 并 在 Rectangle 的 任何 一 个 角落 在 Circle 之 内 时 返回 
True。 另 外 ， 还 有 一 个 更 难 的 版 本 ， 需 要 在 Rectangle 的 任何 部 分 都 沙 在 
圆圈 之 内 时 返回 True。 


解答 : http://thinkpython2.com/code/Circle.py 。 
练习 15-2 


编写 一 个 名 为 draw_rect 的 函数 ， 接 收 一 个 Turtle 对 象 和 一 个 
Rectangle 对 象 作 为 形 参 ， 并 使 用 Turtle 来 绘制 这 个 Rectangle。 如 何 使 用 
Turtle 对 象 的 示例 参见 第 4 章 。 





编写 一 个 名 为 draw_rect 的 函数 ， 接 收 一 个 Turtle 对 象 和 一 个 Circle 


对 象 ， 并 绘制 出 Circle。 


解答 : http://thinkpython2.com/code/draw.py 。 


第 16 半 类 和 函数 


现在 我 们 已 经 知道 如 何 创建 新 的 类 型 ， 下 一 步 是 编写 接收 用 户 定义 
对 象 作为 参数 或 者 将 其 当 作 结果 返回 的 函数 。 本 章 我 会 展示 “函数 式 编 
程 风 格 ?， 以 及 两 个 新 的 程序 开发 计划 。 





本 章 的 代码 示例 可 以 从 http://thinkpython2.com/code/Timel.py 下 载 。 
练习 的 解答 在 http://thinkpython2.com/code/Time1_soln.py。 


16.1 时间 


作为 用 户 定 义 类 型 的 男 一 个 例子 ， 我 们 定义 一 个 叫 作 Time 的 类 ， 
用 于 记录 一 天 里 的 时 间 。 类 定义 如 下 : 


class Time: 
"""Represents the time of day. 


attributes: hour, minute, second 





我 们 可 以 创建 一 个 Time 对 象 并 给 其 属性 小 时 数 、 分 钟 数 和 秒 钟 数 
赋值 : 
time = Time() 


time.hour = 11 
time.minute = 59 


time.second = 30 





Time 对 象 的 状态 图 参见 图 16-1。 


作为 练习 ， 编 写 一 个 叫 作 print_time 的 函数 ， 接 收 一 个 Time 对 象 
作为 形 参 并 以 “hour :minute:second ”的 格式 打印 它 。 提 示 : 格式 序 
列 '%.2d' 可 以 以 最 少 两 个 字符 打印 一 个 整数 ， 如 果 和 需要， 它 会 在 前 面 
添加 前 级 0。 


Time 
time —~> hour —> 11 
minute —> 59 


second —> 30 





图 16-1 对 象 图 
编写 一 个 布尔 函数 is_after ， 接 收 两 个 Time 对 象 ，t1 和 t2 ， 并 


若 t1 在 t2 时 间 之 后 则 返回 True ， 否 则 返回 False 。 挑 战 : 不 许 使 
用 if 表达 式 。 


16.2 #4 pk Br 


在 下 面 儿 节 中 ， _ ee 数 。 它 们 展示 
了 两 种 不 同类 型 的 函数 : 纯 函 数 和 修改 嚣 。 它 们 也 展示 了 我 会 称 为 原型 
和 补丁 an 的 开发 计划 。 这 是 一 种 对 应 复杂 问题 的 
方法 ， 从 一 个 简单 的 原型 开始 ， 并 逐渐 解决 更 多 的 复杂 情况 。 


下 面 是 add_time 的 一 个 简单 原型 : 


def add time(t1, t2): 
sum = Time() 
sum.hour = t1.hour + t2.hour 
sum.minute = t1.minute + t2.minute 


sum.second = t1.second + t2.second 
return sum 





函数 创建 一 个 新 的 Time 对 象 ， 初 始 化 它 的 属性 ， 并 返回 这 个 新 
a. BRIA TAAL, BIA BR SB lM 
外 ， 并 不 修改 作为 实 参 传 入 的 任何 对 象 ， 也 没有 任何 如 显示 值 或 获得 用 
户 输入 之 类 的 副作用 。 





为 了 测试 这 个 函数 ， 我 将 创建 两 个 Time 对 象 : start ， 存 放 一 个 电 
影 ( 如 Monty Python and the Holy Grail ) 的 开始 时 间 ; duration, 4 
放电 影 的 播放 时 间 ， 在 这 里 是 1 小 时 35 分 钟 。 


add_time 计算 出 电影 何 时 结束 。 


>>> start = Time() 
>>> start.hour = 9 


>>> start.minute 
>>> start.second 


0 


>>> duration = Time() 


>>> duration.hour = 1 
>>> duration.minute = 35 
>>> duration.second = 6 


>>> done = add_time(start, duration) 
>>> print_time(done) 
10:80:00 





结果 16:86:66 可 能 并 不 是 你 所 期 望 的 。 问 题 在 于 这 个 函数 并 没有 
处 理 好 秒 数 或 者 分 钟 数 超过 60 的 情况 。 当 此 发 生 时 ， 我 们 需要 将 多 余 的 
秒 数 “进位 ”到 分 钟 数 ， 将 多 余 的 分 钟 数 “进位 ”到 小 时 数 。 


下 面 是 一 个 改进 的 版 本 : 


def add time(t1, t2): 
sum = Time() 
sum.hour = t1.hour + t2.hour 
sum.minute = t1.minute + t2.minute 
sum.second = t1.second + t2.second 


if sum.second >= 60: 
sum.second -= 60 
sum.minute += 1 


if sum.minute >= 60: 
sum.minute -= 60 
sum.hour += 1 


return sum 





里 然 这 个 函数 是 正确 的 ， 它 已 经 开始 变 大 了 。 我 们 会 在 后 面 看 到 一 
个 更 短 的 版 本 。 


16.3 (MA 


有 时 候 用 函数 修改 传 入 的 参数 对 象 是 很 有 用 的 。 在 这 种 情况 下 ， 修 
改 对 调用 者 是 可 见 的 。 这 样 工作 的 函数 称 为 修改 器 (modifier) 。 


函数 increment 给 一 个 Time 对 象 增加 指定 的 秒 数 ， 可 以 目 然 地 与 
为 一 个 修改 器 。 下 面 是 一 个 初稿 : 
def increment(time, seconds): 

time.second += seconds 

if time.second >= 60: 


time.second -= 60 
time.minute += 1 


if time.minute >= 60: 
time.minute -= 60 
time.hour += 1 





第 一 行进 行 基础 操作 ;后面 的 代码 处 理 我 们 前 面 看 到 的 特殊 情况 


这 个 函数 正确 吗 ? 如 果 seconds 比 60 大 很 多 ， 会 发 生 什 么 ? 





在 那 种 情况 下 ， 只 进位 一 次 是 不 够 的 ; 我们 需要 重复 进位 ， 
ee second 比 60 小 。 一 个 办 法 是 使 用 while 语句 替代 if E 那 
样 会 让 函数 变 正确 ， 但 并 不 很 高 效 。 作 为 练习 ， 编 写 正确 的 ijncrement 
Hoe 并 不 包含 任何 循环 。 


任何 可 以 使 用 修改 器 做 到 的 功能 都 可 以 使 用 纯 函 数 实 现 。 事 实 上 ， 
有 的 编程 语言 只 允许 使 用 纯 函 数 。 有 证 据 表 明 使 用 纯 函 数 的 程序 比 使 用 





eens 错误 更 少 。 但 有 时 候 修改 器 还 是 很 方便 的 ， 并 
函数 式 程序 的 运行 效率 不 那么 高 。 








忆 的 来 说 ， 我 推荐 你 只 要 合理 的 时 候 ， 部 尽量 编写 纯 函数 ， 而 只 在 
有 绝对 说 服 力 的 原因 时 才 使 用 修改 禹 。 这 种 方法 可 以 称 作 函数 式 编 程 风 
格 。 





作为 练习 ， 编 写 一 个 increment 的 纯 闵 数 版 本 ， 创 建 并 返回 一 个 新 
的 Time 对 象 ， 而 不 是 修改 参数 。 


16.4 ”原型 和 计划 





刚才 我 展示 的 开发 计划 称 为 "原型 和 补 本 ”。 对 每 个 函数 ， 我 编写 一 
个 可 以 进行 基本 计算 的 原型 ， 再 测试 它 ， 从 中 发 现 错误 并 打 补 丁 。 








这 种 方法 在 对 问题 的 理解 并 不 深入 时 尤其 有 效 。 但 增 量 地 修正 可 能 
会 导致 代码 过 度 复 淋 〈 因 为 它们 需要 处 理 很 多 特殊 情况 ) ， 并 且 也 不 够 
可 徘 (因为 很 难 知道 你 是 否 已 经 找到 了 所 有 错误 )。 


另 一 种 方法 是 有 规划 开发 (designed development) 。 对 问题 有 更 
高 阶 的 理解 能 够 让 编程 简单 得 多 。 在 上 面 的 问题 中 ， 如 果 更 深入 地 理 
解 ， 可 以 发 现 Time 对 象 实 际 上 是 六 十 进 制 数 里 的 3 位 数 〈 参 见 
http://en.wikipedia.org/wiki/Sexagesimal) ! second 属性 是 “个 位 
aX”, minute 属性 是 “60 位 数 ”"， 而 hour 属性 是 “360 位 数 ”。 








在 编写 add_time 和 increment 时 ， 我 们 实际 上 是 在 六 十 进 制 上 进 
行 加 减 ， 因 此 才 需 要 从 一 位 进位 到 另 一 位 。 


这 个 观 罕 让 我 们 可 以 考虑 整个 问题 的 另 一 种 解决 方法 一 一 我 们 可 以 
将 Time 对 象 转换 为 整数 ， 并 利用 计算 机 知道 如 何 做 整数 运算 的 事实 。 


下 面 是 一 个 将 Time 对 象 转换 为 整数 的 函数 : 


def time_to_int(time): 
minutes = time.hour * 60 + time.minute 
seconds = minutes * 66 + time.second 


return seconds 





而 下 面 是 一 个 将 整数 转换 回 Time 对 象 的 函数 〈 记 着 divmod 函数 将 
第 一 个 参数 除 以 第 二 个 参数 ， 并 以 元 组 的 形式 返回 商 和 余数 ) : 


def int to time(seconds): 
time = Time() 
minutes, time.second = divmod(seconds, 60) 


time.hour, time.minute = divmod(minutes, 60) 
return time 





你 可 能 需要 思考 一 下 ， 并 运行 一 些 测 试 ， 来 说 服 自己 这 些 函 数 是 正 
确 的 。 一 种 测试 它们 的 方法 是 对 很 多 x 值 检查 
time to int(int to time(x)) == x 。 这 是 一 致 性 检验 的 一 个 例 
nie 





一 旦 确认 它们 是 正确 的 ， 束 可 以 使 用 它们 重 写 add_time : 


def add time(t1, t2): 
seconds = time to int(t1) + time to int(t2) 


return int to time(seconds) 





这 个 版 本 比 最 初版 本 短 得 多 ， 并 且 也 很 容易 检验 。 作 为 练习 ， 使 
用 time to_int 和 int_ to time 重 写 increment KAŽ. 


从 某 个 角度 看 ， 在 六 十 进 制 和 十 进 制 之 间 来 回转 换 比 只 处 理 时间 更 
难 。 进 制 转换 更 加 抽象 ， 我 们 对 时 间 值 的 直 党 更 好 。 


但 如 果 我 们 将 时 间 看 作 六 十 进 制 数 ， 并 做 好 了 编写 转换 函数 
(time_to_int 和 int to time ) 的 先期 投入 ， 就 能 得 到 一 个 更 短 ， 
更 可 读 ， 也 更 可 靠 的 函 数 。 


它 也 让 我 们 今后 更 容易 添加 功能 。 例 如 ， 假 设 将 两 个 Time 对 象 相 减 
来 获得 它们 之 间 的 时 间 间 隔 。 简 单 的 做 法 是 使 用 借 位 实现 减法 。 而 使 用 
转换 函数 则 更 简单 ， 且 更 容易 正确 。 





讽刺 的 是 ， 有 时 候 把 一 个 问题 弄 得 更 难 〈 或 者 更 通用 ) 反而 会 让 它 
更 简单 〈 因 为 会 有 更 少 的 特殊 情况 以 及 更 少 的 出 错 机 会 ) 。 


16.5 ”调试 


一 个 Time 对 象 当 minute 和 second 的 值 在 0 到 60 之 间 (包含 0 但 不 包 
60) 以 及 hour 是 正 值 时 ， 是 合法 的 。hour 和 minute 应 当 是 整数 
值 ， 但 我 们 也 许 需 要 人 允许 second 拥有 小 数值 。 


这 些 需求 称 为 不 变 式 ， 因 为 它们 应 当 总 是 为 真 。 换 句 话 说 ， 如 果 
它们 不 为 真 ， 则 一 定 有 什么 地 方 出 错 了 。 





编写 代码 来 检查 不 变 式 可 以 帮 你 探测 错误 并 找寻 它们 的 根源 。 例 
如 ， 你 可 以 写 一 个 像 valid time 这 样 的 函数 ， 接 收 Time 对 象 ， 并 在 它 
违反 了 一 个 不 变 式 时 ， 返 回 False : 


def valid_time(time): 
if time.hour < © or time.minute < © or time.second < 6: 
return False 
if time.minute >= 60 or time.second >= 60: 


return False 
return True 








eA TERE T A BUINIP SA, AAS, HR ETE A: 


def add_time(t1, t2): 
if not valid_time(t1) or not valid_time(t2): 
raise ValueError('invalid Time object in add _time') 


seconds = time_to_int(t1) + time_to_int(t2) 
return int_to_time(seconds) 





或 者 可 以 使 用 一 个 assert 语句 。 它 会 检查 一 个 给 定 的 不 变 式 ， 并 


当 检 查 失败 时 抛 出 异常 : 


def add_time(t1, t2): 
assert valid_time(t1) and valid_time(t2) 
seconds = time_to_int(t1) + time_to_int(t2) 


return int_to_time(seconds) 





assert 语句 很 有 用 ， 因 为 它们 区 分 了 处 理 普 通 条 件 的 代码 和 检查 
错误 的 代码 。 


16.6 ÑEK 


原型 和 补丁 Cprototype and patch) : 一 种 开发 计划 模式 ， 先 编写 程 
序 的 粗略 原型 ， 并 测试 ， 在 找到 错误 时 更 正 。 


有 规划 开发 (planned development) : 一 种 开发 计划 模式 ， 先 对 问 
题 有 了 高 阶 的 深入 理解 ， 并 且 比 增 量 开发 或 者 原型 开发 有 更 多 的 规划 。 





纯 函 数 (pure function) : 不 修改 任何 形 参 对 象 的 函数 。 大 部 分 纯 
函数 都 有 返回 值 。 


修改 器 (modifier) : 修改 一 个 或 多 个 形 参 对 象 的 函数 。 大 部 分 修 
改 禹 都 不 返回 值 ， 也 就 是 返回 None 。 


函数 式 编程 风格 (functional programming style) : 一 种 编程 设计 风 
格 ， 其 中 大 部 分 函数 都 是 纯 函 数 。 
不 变 式 (invariant) : 在 程序 的 执行 过 程 中 应 当 总 是 为 真 的 条 件 。 


assert 语句 (assert statement) : 一 种 检查 某 个 条 件 ， 如 果 检 查 失 
败 则 抛 出 异常 的 语句 。 


16.7 练习 


本 章 中 的 代码 示例 可 以 从 http://thinkpython2.com/code/Timel.py 下 
载 ， 这 些 练习 的 解答 可 以 从 http://thinkpython2.com/code/Timel_soln.py 下 


练习 16-1 


编写 一 个 函数 mul_time 接收 一 个 Time 对 象 以 及 一 个 整数 ， 返 回 一 
个 新 的 Time 对 象 ， 包 含 原始 时 间 和 整数 的 乘积 。 





然后 使 用 mul_time 来 编写 一 个 函数 ， 接 收 一 个 Time 对 象 表示 一 场 
赛车 的 结束 时 间 ， 以 及 一 个 表示 距离 的 数字 ， 并 返回 一 个 Time 对 象 表达 
平均 节奏 《每 英里 花费 的 时 间 ) 。 


练习 16-2 


datetime 模块 提供 了 time 对 象 ， 和 本 章 中 的 Time 对 象 类 似 ， 但 它 
们 提供 了 更 丰富 的 方法 和 操作 符 。 在 
http://docs.python.org/3/library/datetime.html 闵 读 相 关 文 档 。 


1. 使 用 datetime 模块 来 编写 一 个 程序 获取 当前 日 期 并 打印 出 今天 
He Fil J Lo 


2. 编写 一 个 程序 接收 生日 作为 输入 ， 并 打印 出 用 户 的 年 龄 ， 以 及 
到 他 们 下 一 次 生日 还 需要 的 天 数 、 小 时 数 、 分 钟 数 和 秒 数 。 











3 对 于 生 于 不 同 天 的 两 个 人 sy, 总 有 一 天 : 一 个 人 的 年 龄 是 男 一 个 
人 的 两 倍 。 我 们 称 这 是 他 们 的 “ 双 倍 日 "。 编 写 一 个 程序 接收 两 个 生日 ， 
并 计算 出 它们 的 “ 双 倍 日 ”。 

4. 再 增加 一 点 挑战 ， 编 写 一 个 更 通用 的 版 本 ， 计 算 一 个 人 比 为 一 
个 人 大 n 倍 的 日 子 。 


解答 : http://thinkpython2.com/code/double.py。 


第 17 章 ”类 和 方法 





虽然 我 们 已 经 使 用 了 Python 的 一 些 面 癌 对 象 特性 ， 但 前 两 章 的 程序 
还 算 不 上 真正 的 面向 对 象 ， 因 为 它们 没有 体现 用 户 自 定义 类 型 之 间 的 关 
联 ， 以 及 操作 它们 的 函数 。 下 一 步 是 将 那些 函数 转换 成 方法 ， 让 这 种 关 
联 更 加 明显 。 





本 章 的 代码 示例 可 以 从 http://thinkpython2.com/code/Time2.py 下 载 ， 
而 本 章 练习 的 解答 参见 http:Wthinkpython2.com/code/Point2_soln.py。 


17.1 ”面向 对 象 特性 


Python 是 一 门面 辣 对 象 编程 语言 ， 它 提供 了 一 些 文 持 面 问 对 象 编 
程 的 语言 特性 ， 这 些 特性 有 如 下 明确 的 特征 。 


。 程序 包括 类 定义 和 方法 定义 。 

© 大 部 分 计算 都 通过 对 象 的 操作 来 表达 。 

。 每 个 对 象 定义 对 应 真实 世界 的 某 些 对 象 或 概念 ， 而 方法 则 对 应 真实 
世界 中 对 象 之 间 交 互 的 方式 。 











例如 ， 第 16 章 中 定义 的 Time 类 对 应 于 人 们 记录 一 天 中 的 时 间 的 方 
式 ， 而 其 中 我 们 定义 的 函数 对 应 于 人 们 平时 处 理 时 间 所 做 的 事情 。 类 似 
地 ，Point 和 Rectangle 类 对 应 于 数学 中 点 和 和 矩形 的 概念 。 


目前 为 止 ， 我 们 还 没有 利用 上 Python 所 提供 的 面向 对 象 编程 特性 。 
严格 地 说 ， 这 些 特性 并 不 是 必需 的 ;， 它 们 中 大 部 分 都 是 我 们 已 经 做 过 的 
事情 的 另 一 种 选择 方案 。 但 在 很 多 情况 下 ， 这 种 方案 更 简洁 ， 更 能 准确 
地 表达 程序 的 结构 。 











例如 ， 在 Time1.py 程序 中 ， 类 定义 和 接 帮 的 函数 定义 并 没有 明显 
的 关联 。 稍 加 观察 ， 很 明显 每 个 函数 都 全 少 接收 一 个 Time 对 象 作 为 参 
数 。 





这 种 现象 就 是 方法 的 由 来 。 一 个 方法 即 是 和 茶 个 特定 类 相关 联 的 
函数 。 我 们 已 经 见 过 字符 串 、 列 表 、 字 典 和 元 组 的 方法 。 本 章 中 ， 我 们 
会 为 用 户 定 义 类 型 定义 方法 。 


方法 和 函数 在 语义 上 是 一 样 的 ， 但 在 语法 上 有 两 个 区 别 。 





。 方法 定义 写 在 类 定义 之 中 ， 更 明确 的 表示 类 和 方法 的 关联 。 
。 调用 方法 和 调用 函数 的 语法 形式 不 同 。 





在 接 下 来 儿 节 中 ， 我 们 会 将 前 两 草 中 定义 的 函数 转换 为 方法 。 这 种 
转换 是 纯 机 械 式 的 ; 你 可 以 依照 一 系列 步 又 完成 它 。 如 果 你 能 够 轻松 地 
在 方法 和 函数 之 间 转 换 ， 也 就 能 够 在 任何 情况 下 选择 最 适合 的 形式 了 。 





17.2 ”打印 对 象 


在 第 16 章 中 ， 我 们 在 练习 16-1 中 定义 了 一 个 名 为 Time 的 类 ， 你 写 
过 一 个 名 为 print_time 的 函数 : 


class Time: 
"""Represents the time of day.""" 


def print_time(time): 
print('%.2d:%.2d:%.2d' % (time.hour, time.minute, time.second) ) 





要 调用 这 个 函数 ， 需 要 传 入 一 个 Time 对 象 作 为 实 参 : 


>>> start = Time() 
>>> start.hour = 9 
>>> start.minute = 45 
>>> start.second = 00 
>>> print_time(start) 
69:45:00 





要 把 print_time 转换 为 方法 ， 我 们 只 需要 将 函数 定义 移动 到 类 定 
义 中 即 可 。 注 意 缩 进 的 改变 。 


class Time: 
def print_time(time): 


print('%.2d:%.2d:%.2d' % (time.hour, time.minute, time.second) ) 





现在 有 两 种 方式 可 以 调用 print_time 。 第 一 种 〈 更 少见 的 ) 方式 
是 使 用 函数 调用 语法 : 


>>> Time.print_time(start) 
69:45:00 





在 这 里 的 点 表示 法 中 ，Time 是 类 的 名 称 ， 而 print_time 是 方法 的 
名 称 。start 是 作为 参数 传 入 的 。 


A CRRA) 方式 是 使 用 方法 调用 语法 : 


>>> start.print_time() 
69:45:00 





在 这 里 的 点 表示 法 中 ，print_time (又 一 次 ) 是 方法 的 名 称 ， 
而 start 是 调用 这 个 方法 的 对 象 ， 也 称 为 主体 〈subject) 。 和 一 句 话 中 
主语 用 来 表示 这 人 句 话 是 关于 什么 东西 的 一 样 ， 方 法 调用 的 主体 表示 这 个 
方法 是 关于 哪个 对 象 的 。 








在 方法 中 ， 主 体会 被 赋值 给 第 一 个 形 参 ， 所 以 本 例 中 start 被 赋值 
给 time 。 

依 惯例 来 ， 方 法 的 第 一 个 形 参 通常 叫 作 self ， 所 以 print_time 通 
党 写成 这 样 的 形式 : 


class Time: 
def print_time(self): 


print('%.2d:%.2d:%.2d' % (self.hour, self.minute, self.second) ) 





这 种 惯例 的 原因 是 一 个 隐喻 。 


。 函数 调用 的 语法 print_time(start) 暗示 函数 是 活动 主体 。 它 仿 
佛 在 说 : “IR, print_time ! 这 里 是 一 个 让 你 打印 的 对 象 。” 

。 在 面 癌 对象 编程 中 ， 对 象 是 活动 主体 。 类 似 start.print_time() 
的 方法 调用 相当 于 说 :“ 咀 ，start ! 请 打印 你 自己 。” 














这 种 视角 的 改变 可 能 变 得 更 礼貌 ， 但 是 否 也 更 有 用 这 一 点 却 不 那么 
明显 。 在 我 们 已 经 见 过 的 例子 中 ， 它 也 许 并 没有 更 有 用 。 但 有 时 候 将 函 
数 的 贡 任 转 到 对 象 上 ， 使 我 们 能 够 编写 功能 更 丰富 的 函数 或 方法 ) ， 
也 使 代码 的 维护 和 复 用 更 容易 。 











作为 练习 ， 将 16.4 节 中 的 函数 time_to_int 重 写 为 方法 。 你 大 概 也 
会 想 将 int_to_time 重 写 为 方法 ， 但 这 么 做 实际 上 没有 什么 意义 ， 
为 你 找 不 到 可 以 调用 它 的 对 象 。 


17.3” 男 一 个 示例 


下 面 是 函数 increment (参见 16.3 节 ) 的 另 一 个 重 写 成 了 方法 的 版 
本 : 


# inside class Time: 


def increment(self, seconds): 


seconds += self.time_to_int() 
return int_to_time(seconds) 





这 个 版 本 假设 time_to_int 已 经 写成 了 方法 。 另 外 ， 注 意 它 是 一 
个 纯 函数 ， 而 不 是 一 个 修改 絮 。 


下 面 是 调用 increment 的 方式 : 


>>> start.print_time() 
69:45:00 
>>> end = start.increment (1337) 


>>> end. print_time() 
10:07:17 





主体 start 赋值 给 第 一 个 形 参 self ， 实 参 1337 ， 赋 值 给 第 二 个 形 


参 seconds 。 


这 种 机 制 有 时 也 会 带 来 困惑 ， 尤 其 在 当 程 序 出 错 的 时 候 。 例 如 ， 如 
果 使 用 两 个 实 参 调 用 increment ， 则 会 得 到 : 


>>> end = start.increment(1337, 460) 


TypeError: increment() takes 2 positional arguments but 3 were given 


错误 信息 初 看 起 来 似乎 很 令 人 困惑 ， 因 为 括号 里 只 有 两 个 实 参 。 但 
调用 的 主体 也 被 看 作 一 个 实 参 ， 所 以 其 实 总 共有 3 个 。 











另外 ， 按 位 实 参 (positional argument) 指 的 是 没有 指定 名 称 的 实 
参 ， 也 就 是 说 ， 它 不 是 一 个 关键 词 实 参 。 在 下 面 这 个 函数 调用 
H, parrot 和 cage 是 按 位 实 参 ， 而 dead 是 一 个 关键 词 实 参 : 


sketch(parrot, cage, dead=True) 





17.4 —S RRR ABI 


a ( 见 16.1 节 ) 稍微 更 复杂 一 些 ， 因 为 它 接收 两 
个 Time 对 象 作 为 形 参 。 这 种 情形 下 ， 依 惯例 ， 第 一 个 形 参 命名 为 self 
， 而 第 二 个 形 参 命名 为 other : 


# inside class Time: 


def is_after(self, other): 


return self.time_to_int() > other.time_to_int() 





要 使 用 这 个 方法 ， 需 要 在 一 个 对 象 上 调用 它 ， 并 传 入 另 一 个 对 象 作 


>>> end.is_after(start) 
True 





这 种 语法 的 一 个 好 处 是 ， 阅 读 起 来 几乎 和 英语 一 样 :“end is after 


start?” - 


17.5 init 方法 








init 方法 〈 即 “initialization" 的 简写 ， 意 思 是 初始 化 ) 是 一 个 特殊 
方法 ， 当 对 象 初始 化 时 会 被 调用 。 它 的 全 名 是 _ init_ 《两 个 下 划 
线 ， 接 着 是 init ， 再 接着 两 个 下 划 线 ) 。Time 类 的 init 方法 可 能 如 
下 所 示 : 


# inside class Time: 


def _ init__(self, hour=0, minute=@, second=0): 
self.hour = hour 


self.minute = minute 
self.second = second 








_init__ 的 形 参 和 类 的 属性 名 称 常 常 是 相同 的 。 语 句 


self.hour = hour 


将 形 参 hour 的 值 存储 为 self 的 一 个 属性 。 


形 参 是 可 选 的 ， 所 以 当 你 不 使 用 任何 实 参 调用 Time 时 ， 会 得 到 默 


>>> time = Time() 
>>> time.print_time() 


08:00:00 





WRGHAT LE, CRA mhor : 


>>> time = Time (9) 
>>> time.print_time() 


09:00:00 





如 果 提 供 2 个 实 参 ， 它 会 覆盖 hour 和 minute : 


>>> time = Time (9，45) 
>>> time.print_time() 


09:45:00 





如 果 提 供 3 个 实 参 ， 它 们 会 覆盖 全 部 3 个 默认 值 。 


作为 练习 ， 为 Point 类 编写 一 个 init 方法 ， 接 收 x My 作为 可 选 形 
参 ， 并 将 它们 的 值 赋 到 对 应 的 属性 上 。 


176 _ str 方法 


_str _ 和 _init 类似 ， 是 一 个 特殊 方法 ， 它 用 来 返回 对 象 的 
字符 串 表 达 形 式 。 


例如 ， 下 面 是 一 个 Time 对 象 的 str 方法 : 


# inside class Time: 


def _str (self): 


return '%.2d:%.2d:%.2d' % (self.hour, self.minute, self.second) 





当 你 打印 对 象 时 ，Python 会 调用 str 方法 。 


>>> time = Time(9, 45) 
>>> print(time) 


09:45:00 








当 我 编写 一 个 新 类 时 ， 我 忌 是 开始 先 写 _ init__， 以 便 初 始 化 对 
象 ， 然 后 会 写 _ str _ ， 以 便 调试 。 


作为 练习 ， 为 Point 类 编写 一 个 str 方法 。 创 建 一 个 Point 对 象 并 打 
印 它 。 


17.7 ERNER 


通过 定义 其 他 的 特殊 方法 ， 你 可 以 为 用 户 定义 类 型 的 各 种 操作 符 指 
定 行为 。 例 如 ， 如 果 你 为 Time 类 定义 一 个 “add “方法 ， 则 可 以 在 
Time 对 象 上 使 用 + 操作 符 。 


下 面 是 这 个 方法 的 定义 : 


# inside class Time: 


def _add (self, other): 


seconds = self.time to int() + other.time to int() 
return int to time(seconds) 





而 下 面 是 如 何 使 用 它 : 


>>> start = Time(9, 45) 
>>> duration = Time(1, 35) 
>>> print(start + duration) 


11:20:00 





当 你 对 Time 对 象 应 用 + 操作 符 时 ，Python 会 调用 _add__。 当 你 打 
印 结果 时 ，Python 会 调用 _str _ 。 幕 后 其 实 发 生 了 很 多 事情 ! 


修改 操作 符 的 行为 以 便 它 能 够 作用 于 用 户 定 义 类 型 ， 这 个 过 程 称 为 
操作 符 重 载 。 对 每 一 个 操作 符 ，Python 都 提供 了 一 个 对 应 的 特殊 方法 ， 
如 _add  。 更 多 细节 ， 可 以 参见 
http://docs.python.org/3/reference/datamodel.html#specialnames。 


作为 练习 ， 为 Point 类 编写 一 个 add 方法 。 


17.8 ”基于 类 型 的 分 发 


在 前 面 一 市 中 我 们 将 两 个 Time 对 象 相 加 ， 但 你 也 可 能 会 想 要 将 一 个 
Time 对 象 加 上 一 个 整数 。 接 下 来 是 _add__ 的 一 个 版 本 ， 检 查 other 的 


类 型 ， 并 调用 add_time 或 increment : 


# inside class Time: 


def _add (self, other): 
if isinstance(other, Time): 
return self.add_time(other) 
else: 
return self.increment (other ) 


def add_time(self, other): 
seconds = self.time_to_int() + other.time_to_int() 
return int_to_time(seconds) 


def increment(self, seconds): 
seconds += self.time_to_int() 
return int_to_time(seconds) 





内 置 函数 isinstance 接收 一 个 值 与 一 个 类 对 象 ， 并 当 此 值 是 此 类 
的 一 个 实例 时 返回 True 。 


如 果 other 是 一 个 Time 对 象 ， add _ 会 调用 add_time 。 否 则 它 
认为 实 参 是 整数 ， 并 调用 increment 。 这 个 操作 称 为 基于 类 型 的 分 发 
(type-based dispatch) ， 因 为 它 根据 形 参 的 类 型 ， 将 计算 分 发 到 不 同 的 
bs 


下 面 是 使 用 不 同类 型 的 实 参 调用 + 操作 符 的 示例 : 


>>> start = Time(9, 45) 

>>> duration = Time(1, 35) 
>>> print(start + duration) 
11:20:00 


>>> print(start + 1337) 
10:07:17 





遗憾 的 是 ， 这 个 加 法 的 实现 并 不 满足 交换 律 。 如 果 整 数 是 第 一 个 操 
作 数 ， 则 会 得 到 : 


>>> print(1337 + start) 
TypeError: unsupported operand type(s) for +: ‘int' and ‘instance’ 





问题 在 于 ， 这 里 和 之 前 询问 一 个 Time 对 象 加 上 一 个 整数 不 同 ， 
Python 在 询问 一 个 整数 去 加 上 一 个 Time 对 象 ， 而 它 并 不 知道 如 何 去 做 
到 。 但 这 个 问题 也 有 一 个 聪明 的 解决 方案 : 特别 方法 _radd ， 意 
即 “ 右 加 法 ”(right-side add) 。 当 Time 对 象 出 现在 + 号 的 右 侧 时 ， 会 调 
用 这 个 方法 。 下 面 是 它 的 定义 : 


# inside class Time: 


def _radd (self, other): 


return self. add (other) 





而 下 面 是 如 何 使 用 : 


>>> print(1337 + start) 
10:07:17 





作为 练习 ， 为 Point 类 编写 一 个 add 方法 ， 可 以 接收 一 个 Point 对 象 或 
省 一 修志 组， 


。 如 果 第 二 个 操作 对 象 是 一 个 Point 对 象 ， 则 方法 应 该 返回 一 个 新 的 
Point 对 象 ， 其 x 坐标 是 两 个 操作 对 象 的 x 坐标 的 和 ，y 坐标 也 是 类 
{Uh 

。 如 果 第 二 个 操作 对 象 是 一 个 元 组 ， 方 法 则 将 第 一 个 元 素 和 x A 
加 ， 将 第 二 个 元 素 和 y 坐标 相 加 ， 并 返回 一 个 包含 相 加 结果 的 新 
PointX} & 


1. 9 BR 


当 需 要 时 ， 基 于 类 型 的 分 发 很 有 用 ， 但 《〈 圣 和 运 的 是 ) 我 们 并 不 总 是 
。 通 第 可 以 编写 函数 处 理 不 同类 型 的 参数 来 避免 它 。 


我 们 编写 的 很 多 处 理 字符 串 的 函数 ， 实 际 上 对 其 他 序列 类 型 也 可 以 
用 。 例 如 ， 在 11.1 节 中 ， 我 们 使 用 histogram 来 记录 单词 中 每 个 字母 出 
现 的 次 数 : 








def histogram(s): 
d = dict() 
for c ins: 
if c not in d: 
d[c] =1 


else: 
d[c] = d[c]+1 
return d 








函数 对 列表 、 元 组 其 至 是 字典 都 可 用 ， 只 要 s 的 元 素 是 可 散 列 
的 ， 有 的 键 即 可 : 


>>> t = ['spam', 'egg', 'spam', ‘spam', 'bacon', 'spam'] 
>>> histogram(t) 


{'bacon': 1, 'egg': 1, 'spam': 4} 





处 理 多 个 类 型 的 函数 称 为 多 态 (polymorphic) 。 多 态 可 以 促进 代 
码 复 用 。 例 如 ， 用 来 计算 一 个 序列 所 有 元 素 的 和 的 内 置 函数 sum ， 对 所 
有 其 元 素 文 持 加 法 的 序列 都 可 用 。 





由 于 Time 对 象 提供 了 add 方法 ， 它 们 也 可 以 使 用 sum : 


>>> t1 = Time(7, 43) 
>>> t2 = Time(7, 41) 
>>> t3 = Time(7, 37) 
>>> total = sum([t1, t2, t3]) 


>>> print (total) 
23:01:00 





忆 的 来 说 ， 如 果 函 数 内 部 所 有 的 操作 都 支持 某 种 类 型 ， 那 么 这 个 函 
数 就 可 以 用 于 那 种 类 型 。 





当 你 发 现 一 个 写 好 的 函数 ， 竟 然 有 出 人 意料 的 效果 ， 可 以 用 于 没有 
计划 过 的 类 型 时 ， 这 才 是 最 好 的 多 态 。 








17.10 ”接口 和 实现 





面 癌 对 象 设计 的 目标 之 一 是 提高 软件 的 可 维护 性 ， 也 惑 是 说 ， 当 系 
统 的 其 他 部 分 改变 时 ， 程 序 还 能 够 保持 正确 运行 ， 并 且 能 够 修改 程序 来 
适应 新 的 需求 。 





将 接口 和 实现 分 离 的 设计 理念 ， 可 以 帮 我 们 更 容易 达到 这 个 目标 。 
对 于 对 象 来 说 ， 那 意味 着 类 所 提供 的 方法 应 该 不 依赖 于 其 属性 的 表达 方 
式 。 


例如 ， 在 本 章 中 我 们 开发 了 一 个 类 来 表示 一 天 中 的 时 间 。 这 个 类 提 
供 的 方法 包括 time_to_int 、is_after 和 add time 。 








我 们 可 以 使 用 几 种 不 同 的 方式 来 实现 这 些 方 法 。 实 现 的 细节 依赖 于 
我 们 表达 时 间 概 念 的 方式 。 在 本 章 中 ，Time 对 象 的 属性 是 hour 
、minute 和 second 。 

用 另 一 种 方案 ， 我 们 可 以 将 这 些 属 性 蔡 换 成 一 个 整数 ， 表 示 从 凌晨 
开始 到 现在 的 秒 数 。 这 种 实现 可 能 会 让 一 些 方法 ， 如 is_after ， 更 容 
易 实 现 ， 但 也 会 让 男 一 些 方法 更 难 实现 。 


在 部 车 一 个 新 类 时 ， 你 可 能 会 及 现 更 好 的 实现 。 如 果 程 序 中 其 他 部 
分 用 到 你 的 类 ， 则 修改 接口 会 非常 消耗 时 间 ， 并 且 容 易 产生 错误 。 


但 是 ， 如 果 很 谨慎 小 心地 设计 接口 ， 则 可 以 在 不 修改 接口 的 情况 下 
修改 实现 ， 这 样 程序 的 其 他 部 分 就 不 需要 跟着 修改 。 





17.11 调试 


在 程序 运行 的 任何 时 刻 ， 往 对 象 上 添加 属性 都 是 合法 的 ， 但 如 果 遵 
守 更 严格 的 类 型 理论 ， 让 对 象 拥有 相同 的 类 型 却 有 不 同 的 属性 组 ， 会 很 
容易 导致 错误 。 通 常 来 说 ， 在 init 方法 中 初始 化 对 象 的 全 部 属性 是 个 
好 习惯 。 





如 果 并 不 清楚 一 个 对 象 是 否 拥有 某 个 属性 ， 可 以 使 用 内 置 函 
数 hasattr (参见 15.7 节 ) 。 


男 一 种 访问 一 个 对 象 的 属性 的 方法 是 使 用 内 置 函 数 vars ， 它 接收 
一 个 对 象 ， 并 返回 一 个 将 属性 名 称 〈 字 符 串 形式 〉 映射 到 属性 值 的 字典 
WR: 


>>> p = Point(3, 4) 
>>> vars(p) 


{'y': 4, 'x': 3} 





为 了 调试 ， 你 可 能 会 发 现 将 这 个 函数 放 在 手边 是 很 有 用 的 : 


def print_attributes(obj): 
for attr in vars(obj): 


print (attr, getattr(obj, attr)) 





print_attributes 过 有 历 对 象 的 属性 字典 ， 并 打印 出 每 个 属性 的 名 
称 和 相应 的 值 。 


内 置 函数 getattr 接收 一 个 对 象 以 及 一 个 属性 名 称 字符 串 形式 ) 
并 返回 属性 的 值 。 


17.12 NEK 


SAIS (object-oriented language) : 一 种 提供 诸如 用 户 定 义 
类 型 和 方法 之 类 的 语言 特性 ， 以 方便 面 同 对 象 编程 的 语言 。 





面 同 对 象 编 程 (object-oriented programming) : 一 种 编程 风格 ， 数 
据 和 修改 数据 的 操作 组 织 成 类 和 方法 的 形式 。 





方法 (method) : 在 类 定义 之 内 定义 的 函数 ， 在 类 的 实例 上 调 
用 。 





主体 (subject) : 调用 方法 所 在 的 对 象 。 


按 位 实 参 (positional argument) : 一 个 不 包含 参数 名 字 的 实 参 ， 
所 以 它 不 是 一 个 关键 词 实 参 。 


操作 符 重 载 Coperator overloading) : 修改 一 个 类 似 + 号 这 样 的 操作 
符 的 行为 ， 使 之 可 以 用 于 用 户 定义 类 型 。 

基于 类 型 的 分 发 〈type-based dispatch) : 一 种 编程 模式 ， 检 查 操作 
对 象 的 类 型 ， 并 对 不 同类 型 调用 不 同 的 函数 。 

ZA (polymorphic) : 函数 的 一 种 属性 ， 可 以 处 理 多 种 类 型 的 参 
数 。 


言 息 隐藏 (information hiding) : 对 象 提供 的 接口 不 应 当 依 赖 于 其 
实现 ， 特 别 是 其 属性 的 表达 形式 的 原则 。 


17.13 ”练习 


24 >] 17-1 


从 http://thinkpython2.com/code/Time2.py 下 载 本 章 的 代码 。 将 Time 
的 属性 改 为 从 凌晨 开始 到 现在 的 秒 数 。 接 着 修改 方法 (以 及 函数 
int_to_time) ， 以 适应 新 的 属性 实现 。 你 应 该 不 需要 修改 main 里 面 
的 测试 代码 。 当 你 做 完 之 后 ， 输 出 应 该 和 以 前 一 样 。 


解答 : http://thinkpython2.com/code/Time2_soln.py 


练习 17-2 








这 个 练习 提醒 你 关于 Python 的 一 种 最 常见 且 最 难 碍 找 的 错误 的 故 


编写 一 个 叫 作 Kangaroo (袋鼠 ) 的 类 ， 有 如 下 方法 。 


1. 一 个 _init _ 方法 ， 将 属性 pouch_contents (口袋 中 的 东 
西 ) 初始 化 为 一 个 空 列表 。 


2. 一 个 put_in_pouch 方法 ， 接 收 任何 类 型 的 对 象 ， 并 将 它 添 加 
到 pouch_contents F. 


3. 一 个 _str 方法， 返回 Kangaroo 对 象 以 及 口袋 中 的 内 容 的 字 
符 串 表达 形式 。 


创建 两 个 Kangaroo 对 象 ， 将 它们 赋值 到 变量 kanga 和 roo ， 并 


将 roo 添加 到 kanga 的 口袋 中 。 


下 载 http://thinkpython.com/code/BadKangaroo.py， 它 包含 了 前 面 问 
题 的 解答 ， 但 里 面 有 一 个 很 大 很 丑陋 的 bug。 找 出 并 修复 这 个 bug。 








如 果 你 遇 到 阻碍 ， 可 以 下 载 
http://thinkpython.com/code/GoodKangaroo.py， 它 解释 了 问题 的 原因 ， 并 
提供 了 一 个 解决 方案 。 


第 18 半 ”继承 














和 面 辐 对 象 编程 最 党 相关 的 语言 特性 束 是 继承 (inheritance ) 。 继 
承 指 的 是 根据 一 个 现 有 的 类 型 ， 定 义 一 个 修改 版 本 的 新 类 的 能 力 。 本 章 
中 我 会 使 用 几 个 类 来 表达 扑克 脾 、 牌 组 以 及 扑克 牌 型 ， 用 于 展示 继承 特 
PE 








如 果 你 不 玩 扑 克 ， 可 以 在 http://en.wikipedia.org/wiki/Poker 里 阅读 相 
关 介 绍 ， 但 其 实 并 不 必要 ;我 会 在 书 中 介绍 练习 中 所 需 知 道 的 东西 。 


本 章 的 代码 示例 可 以 从 http://thinkpython2.com/code/Card.py 下 载 。 


18.1 卡片 对 象 


一 副 牌 里 有 52 张 牌 ， 共 有 4 个 花色 ， 每 种 花色 13 张 ， 大 小 各 不 相 
同 。 花 色 有 黑 桃 (Spade) 、 红 桃 (Heart) 、 方 片 (Diamond) 和 草花 
(Club) 《在 桥牌 中 ， 这 几 个 花色 是 降序 排列 的 ) 。 每 种 花色 的 13 张 牌 
分 别 为 : Ace、2、3、4、5、6、7、8、9、10、Jack、Queen 和 King。 根 
据 你 玩 的 不 同 游 戏 ，Ace 可 能 比 King 大 ， 也 可 能 比 2 小 。 








如 果 我 们 定义 一 个 新 对 象 来 表示 卡 牌 ， 则 其 属性 显然 应 该 是 rank 
(大 小 ) 和 suit GEE) 。 但 属性 的 值 就 不 那么 直观 了 。 一 种 可 能 是 
使 用 字符 串 ， 例 如 ， 用 'Sspade' 表示 花色 ， 用 'Queen' 表示 大 小 。 这 种 
实现 的 问题 之 一 是 比较 大 小 和 花色 的 高 低 时 会 比较 困难 。 


另 一 种 方案 是 使 用 整数 来 给 大 小 和 花色 编码 。 在 这 个 语 境 中 ,“ 编 


码 "意味 着 我 们 要 定义 一 个 数字 到 花色 ， 或 者 数字 到 大 小 的 映射 。 这 种 
编码 并 不 意味 着 它 是 秘密 (那样 就 应 该 称 为 “< 加密” 了》。 








例如 ， 下 表 展 示 了 花色 和 对 应 的 整数 编码 : 





这 个 编码 令 我 们 可 以 很 容易 地 比较 卡 牌 ， 因 为 更 大 的 花色 映射 到 更 





大 的 数字 上 ， 我 们 可 以 直接 使 用 编码 来 比较 花色 。 


卡 牌 大 小 的 映射 相当 明显 ; 每 个 数字 形式 的 大 小 映射 到 相应 的 整数 
上 ， 而 对 于 人 花 牌 : 











我 使 用 一” 符号， 是 为 了 说 明 这 些 映 射 并 不 是 Python 程序 的 一 部 
分 。 它 们 是 程序 设计 的 一 部 分 ， 但 并 不 在 代码 中 直接 表现 。 





Card 类 的 定义 如 下 : 


class Card: 
"""Represents a standard playing card.""" 


def init (self, suit=0, rank=2): 
self.suit suit 
self.rank rank 








和 前 面 一 样 ，init 方法 对 每 个 属性 定义 一 个 可 选 形 参 。 默 认 的 卡 
脾 是 草花 2。 


要 创建 一 个 Card 对 象 ， 使 用 你 想 要 的 花色 和 大 小 调用 Card : 


queen of diamonds = Card(1, 12) 


18.2 类 属性 


为 了 能 将 Card 对 象 打 印 成 人 们 容易 阅读 的 格式 ， 我 们 需要 将 整数 编 
码 映 射 成 对 应 的 大 小 和 花色 。 自 然 的 做 法 是 使 用 字符 串 列 表 。 我 们 将 这 
些 列表 赋 到 类 属性 E: 

















# 在 Card 类 里 : 





suit_names ['Clubs', 'Diamonds', 'Hearts', 'Spades' | 
rank_names [None, ‘Ace’, '2', '3', '4', '5', '6', '7', 
"g', '9', '10', 'Jack', 'Queen', "King ] 


def _str _(self): 
return '%s of %s' % (Card.rank_names[self.rank], 
Card.suit_names[self.suit]) 








suit_names 和 rank_names 这 样 的 变量 ， 定 义 在 类 之 中 ， 但 在 任 
何方 法 之 外 ， 我 们 称 为 类 属性 。 因 为 它们 是 和 类 对 象 Card 相关 联 的 。 





这 个 术语 和 suit 与 rank 之 类 的 变量 相 区 别 。 那 些 称 为 实例 属性 
， 因 为 它们 是 和 一 个 特定 的 实例 相关 联 的 。 


两 种 属性 都 使 用 句点 表示 法 访问 。 例 如 ， 在 _str F, self & 
一 个 Card 对 象 ， 而 self.rank 是 它 的 大 小 。 相 似 地 ，Card 是 一 个 类 对 
象 ， 而 Card.rank_names 是 关联 到 这 个 类 的 一 个 字符 串 列表 。 


每 个 卡片 都 有 它 自己 的 suit 和 rank ， 但 总 共 只 有 一 


个 suit_names 和 rank_names 。 


综合 起 来 ， 表 达 式 Card.rank_names[self.rank] 意思 是 “使 用 对 
象 self 的 属性 rank 作为 索引 ， 从 类 Card 的 列表 rank_names 中 选择 对 
应 的 字符 串 ”。 





rank_names 的 第 一 个 元 素 是 None ， 因 为 没有 大 小 为 0 的 卡 牌 。 
为 使 用 None 占据 了 一 个 位 置 ， 我 们 就 可 以 得 到 从 下 标 2 到 字符 串 '2' 这 
样 整 齐 的 映射 。 如 果 要 避免 这 种 操作 ， 可 以 使 用 字典 而 不 是 列表 。 


利用 现 有 的 方法 ， 可 以 创建 并 打印 卡 牌 : 


>>> card1 = Card(2, 11) 
>>> print(card1) 
Jack of Hearts 





118-1 aN T Card 类 对 象 和 一 个 Card 实 例 。Card 是 一 个 类 对 象 ， 
所 以 它 的 类 型 是 type 。card1 的 类 型 是 Card 。 为 了 节省 空间 ， 我 没有 
画 出 suit_names 和 rank_names 的 内 容 。 


type list 
Card Suit_names 


rank names 





Card 
card1 sut —~> 1 


rank —~> 11 





图 18-1 对象 图 


18.3 ”对 比 卡 牌 


对 于 内 置 类 型 ， 我 们 用 比较 操作 符 (< 、> 、== 等 ) 来 比较 对 象 并 
决定 哪 一 个 更 大 、 更 小 或 者 相等 。 对 于 用 户 定 义 类 型 ， 我 们 可 以 通过 提 
供 一 个 方法 _1lt ， 代 表 “]ess than”, 来 重 载 内 置 操作 符 的 行为 。 


_1t _ 接收 两 个 形 参 ，self 和 other ， 当 第 一 个 对 象 严格 小 于 第 
二 个 对 象 时 返回 True 。 


卡 牌 的 正确 顺序 并 不 显而易见 。 例 如 ， 章 花 3 和 方 片 2 哪个 更 大 ? 一 
个 牌 面 数 大 ， 男 一 个 花色 大 。 为 了 比较 卡 脾 ， 需 要 决定 大 小 和 花色 哪个 
更 重要 。 


这 个 问题 的 答案 取决 于 你 在 玩 哪 种 牌 类 游戏 ， 但 为 了 简单 起 见 ， 我 
们 随意 做 一 个 决定 ， 认 为 花色 更 重要 ,于 是 ， 所 有 的 黑 桃 比 所 有 的 方 厂 
都 大 ， 依 此 类 推 。 





这 一 点 决定 后 ， 我 们 就 可 以 编写 “lt 函数: 


# 在 Card 类 里 : 


if self.suit < other.suit: return True 


if self.suit > other.suit: return False 


# 人 花色 相同 ， 检 查 大 小 


return self.rank < other .rank 





使 用 元 组 比较 ， 可 以 写 得 更 紧凑 : 




















# 在 Card 类 里 : 


def _ _lt_ _(self, other): 
t1 = self.suit, self.rank 


t2 = other.suit, other.rank 
return t1 < t2 








作为 练习 ， 为 时 间 对 象 编写 一 个 _1t 方法。 你 可 以 使 用 元 组 比 
较 ， 也 可 以 考虑 使 用 整数 比较 。 


18.4 hH 


现在 我 们 已 经 有 了 卡 牌 Ccard) ， 下 一 步 就 是 定义 牌 组 (deck) 。 
由 于 牌 组 是 由 卡 牌 组 成 的 ， 很 自然 地 ， 每 个 Deck 对 象 应 该 有 一 个 属性 包 
含 卡 牌 的 列表 。 


下 面 是 Deck 的 类 定义 。init 方法 创建 cards 属性 ， 并 生成 52 张 牌 
的 标准 牌 组 : 


class Deck: 


def  _init (self): 


self.cards = [] 
for suit in range(4): 


for rank in range(1, 14): 
card = Card(suit, rank) 
self.cards.append(card) 
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小 创建 一 个 新 的 Card 对 象 ， 并 将 它 添加 到 self.cards 中 。 


18.5 ”打印 牌 组 


下 面 是 Deck 的 一 个 、_str_ 方法: 


# 在 Deck 类 里 : 


def _str (self): 
res=[] 
for card in self.cards: 
res.append(str(card)) 
return '\n'.join(res) 





这 个 方法 展示 了 一 种 累积 构建 大 字符 串 的 方法 先 构建 一 个 字符 串 
的 列表 ， 再 使 用 字符 串 方法 join 。 内 置 函 数 str 会 对 每 个 卡 牌 对 象 调 
H str 方法 并 返回 字符 串 表达 形式 。 





由 于 我 们 对 一 个 换行 符 调 用 join 函数 ， 卡 片 之 间 用 换行 分 阳 。 下 
面 是 打印 的 结果 : 


>>> deck = Deck() 
>>> print(deck) 
Ace of Clubs 

2 of Clubs 

3 of Clubs 


10 of Spades 

Jack of Spades 
Queen of Spades 
King of Spades 





虽然 结果 显示 了 52 行 ， 它 仍然 是 一 个 包含 换行 符 的 字符 串 。 


18.6 添加、 删除 、 洗 牌 和 排序 


为 了 能 够 发 竹 ， 我 们 需要 一 个 方法 从 牌 组 中 抽取 一 张 牌 并 返回 。 列 
表 方 法 pop 为 此 提供 了 一 个 方便 的 功能 : 


# 在 Deck 类 里 : 


def pop_card(self): 
return self.cards.pop() 





由 于 pop 从 列表 中 抽出 最 后 SI, BATES ce MEET JER A FP 
的 。 


要 添加 一 个 卡 牌 ， 我 们 可 以 使 用 列表 方法 append : 


# 在 Deck 类 里 : 


def add card(self, card): 


self.cards.append(card) 





像 这 样 调 用 另 一 个 方法 ， 却 不 做 其 他 更 多 工作 的 方法 ， 有 时 候 称 为 
一 个 饰 面 (veneer) 。 这 个 比喻 来 自 于 木工 行业 ， 在 木工 行业 中 人 饰 面 是 
为 了 改善 外 观 而 粘贴 到 便宜 的 木料 表面 的 注 注 的 一 层 优 质 木 料 。 


在 这 个 例子 里 ，add_card 是 一 个 “ 湾 注 ”的 方法 ， 用 更 适合 牌 组 的 
术语 来 表达 一 个 列表 操作 。 它 改善 了 实现 的 外 观 〈 或 接口 ) 。 


作为 另 一 个 示例 ， 我 们 可 以 使 用 random 模块 的 函数 shuffle 来 编 


写 一 个 Deck 方 法 shuffle ( 洗 牌 ): 


# 在 Deck 类 里 : 


def shuffle(self): 


random. shuffle(self.cards) 





不 要 忘记 导入 random 模块 。 


作为 练习 ， 编 写 一 个 Deck 方 法 sort ， 使 用 列表 方法 sort 来 对 一 
Deck 中 的 卡 牌 进行 排序 。sort 使 用 我 们 定义 的 _1t _ 方法 来 决定 
顺序 。 


18.7 继承 


继承 是 一 种 能 够 定义 一 个 新 类 对 现 有 的 某 个 类 稍 作 修改 的 语言 特 
性 。 作 为 示例 ， 假 设 我 们 想 要 一 个 类 来 表达 一 副 “ 手 牌 ”， 即 玩家 手 握 的 
一 副 牌 。 一 副手 牌 和 一 套 牌 组 相似 : 都 是 由 卡 牌 的 集合 组 成 ， 并 且 都 需 
要 诸如 增加 和 移 除 卡 牌 的 操作 。 








一 副手 牌 和 一 套 牌 组 也 有 区 别 ， 我 们 期 望 手 牌 拥 有 的 一 些 操 作 ， 对 
牌 组 来 说 并 无 意义 。 例 如 ， 在 扑 殉 牌 中 ， 我 们 可 能 想 要 比较 两 副手 牌 来 
判断 谁 获胜 了 。 在 桥牌 中 ， 我 们 可 能 需要 为 一 副手 牌 计算 分 数 以 叫 牌 。 








这 种 类 之 间 的 关系 一 一 相似 ， 但 不 相同 一 一 让 它 成 为 继承 。 要 定义 
一 个 继承 现 有 类 的 新 类 ， 可 以 把 现 有 类 的 名 称 放 在 括号 之 中 : 


class Hand(Deck): 


"""Represents a hand of playing cards.""" 





这 个 定义 说 明 Hand 从 Deck 继承 而 来 ， 这 意味 着 我 们 可 以 像 Deck 对 
象 那 样 在 Hand 对 象 上 使 用 pop_card 和 add_card 方法 。 


当 新 类 继承 现 有 类 时 ， 现 有 的 类 被 称 为 父 类 Cparent) ， 而 新 类 则 
称 为 子 类 (child) 。 


在 本 例 中 ，Hand 也 会 继承 Deck Minit _ 方法， 但 它 和 我 们 想 
要 的 并 不 一 样 : 我 们 不 需要 填充 52 张 卡 牌 ，Hand 的 init 方法 应 当初 始 
化 cards 为 一 个 空 列 表 。 


如 果 我 们 为 Hand 类 提供 一 个 init 方法 ， 它 会 覆盖 Deck 类 的 方 
法 : 




















# 在 Hand 类 里 : 


def __init_ _(self, lable=''): 


self.cards = 
self.label 





在 创建 Hand 对 象 时 ，Python 会 调用 这 个 init 方法 而 不 是 Deck 中 的 
那个 : 


>>> hand = Hand('new hand') 
>>> hand.cards 

[] 

>>> hand.label 

'new hand' 





其 他 的 方法 是 从 Deck 中 继承 而 来 的 ， 所 以 我 们 可 以 使 用 pop_card 
和 add_card 来 出 牌 : 


>>> deck = Deck() 

>>> card = deck.pop_card() 
>>> hand.add_card(card) 
>>> print(hand) 


King of Spades 





FAR A PR HW eA BG FS HER IM PIE, 


move_cards : 


# 在 Deck 类 里 : 


def move_cards(self, hand, num): 
for i in range(num): 
hand.add_card(self.pop_card()) 





move_cards 接收 两 个 参数 ， 一 个 Hand 对 象 以 及 需要 出 牌 的 牌 数 。 
它 会 修改 self 和 hand ， 返 回 None 。 


有 的 情况 下 ， 卡 牌 会 从 一 副手 牌 中 移 除 转 入 到 另 一 幅 手 牌 中 ， 或 者 
从 手 牌 中 回 到 牌 组 。 你 可 以 使 用 move_cards 来 处 理 全 部 这 些 操 
YE: self 既 可 以 是 一 个 Deck 对 象 ， 也 可 以 是 一 个 Hand 对 象 。 而 hand 参 
数 ， 虽 然 名 字 是 hand ， 却 也 可 以 是 一 个 Deck 对 象 。 








继承 是 很 有 用 的 语言 特性 。 有 些 程序 不 用 继承 写 ， 会 有 很 多 重复 代 
码 ， 使 用 继承 后 就 会 更 加 优雅 。 继 承 也 能 促进 代码 复 用 ， 因 为 你 可 以 在 
不 修改 父 类 的 前 提 下 对 它 的 行为 进行 定制 化 。 有 的 情况 下 ， 继 承 结 构 反 
映 了 问题 的 自然 结构 ， 所 以 也 让 设计 更 容易 理解 。 


但 另 一 方面 ， 继 承 也 可 能 会 让 代码 更 难 读 。 有 时 候 当 一 个 方法 被 调 
用 时 ， 并 不 清楚 到 哪里 能 找到 它 的 定义 。 相 关 的 代码 可 能 散布 在 几 个 不 
同 的 模块 中 。 并 且 ， 很 多 可 以 用 继承 实现 的 功能 ， 也 能 不 用 它 实 现 ， 甚 
至 可 以 实现 得 更 好 。 


18.8 ”类 图 





至 此 我 们 已 见 过 用 于 显示 程序 状态 的 栈 图 ， 以 及 用 于 显示 对 象 的 属 
性 和 属性 值 的 对 象 图 。 这 些 图 表 展 示 了 程序 运行 中 的 一 个 快照 ， 所 以 当 
程序 继续 运行 时 它们 会 跟着 改变 。 








它们 也 极其 详细 ; 在 某 些 情况 下 ， 是 过 于 详细 了 。 而 类 图 对 程序 结 
构 的 展示 相对 来 说 更 加 抽象 。 它 不 会 具体 显示 每 个 对 象 ， 而 是 显示 各 个 
类 以 及 它们 之 间 的 关联 。 








类 之 间 有 下 面 几 种 关联 。 


一 个 类 的 对 象 可 能 包含 其 他 类 的 对 象 的 引用 。 例 如 ， 每 个 Rectangle 
对 象 都 包含 一 个 到 Point 对 象 的 引用 ， 而 每 一 个 Deck 对 象 包含 到 很 
多 Card 对 象 的 引用 。 这 种 关联 称 为 HAS-A (有 一 个 ) ， 也 就 是 
说 , “和 矩形 (Rectangle) 中 有 一 个 点 (Point) ”。 

一 个 类 可 能 继承 自 另 一 个 类 。 这 种 关系 称 为 ITS-A (是 一 个 ) ， 也 
就 是 说 , “一 副手 牌 〈Hand) 是 一 个 牌 组 (Deck) ”。 

一 个 类 可 能 依赖 于 另 一 个 类 ， 也 就 是 说 ， 一 个 类 的 对 象 接收 另 一 个 
类 的 对 象 作 为 参数 ， 或 者 使 用 另 一 个 类 的 对 象 来 进行 某 种 计算 。 这 
种 关系 称 为 依赖 (dependency) 。 





类 图 用 图 形 展 示 了 这 些 关 系 。 例 如 ， 图 18-2 展 示 了 Card 、Deck 和 
Hand 之 间 的 关系 。 





图 18-2 类 图 





空心 三 角形 箭头 的 线 代 表 着 一 个 IS-A 关 系 ; 这 里 表示 Hand 是 继承 自 
Deck 的 。 


标准 的 箭头 表示 HAS-A 关 系 ; 这 里 表示 Deck 对 象 中 有 到 Card 对 象 的 
引用 。 


AT KEEN BS (x) 表示 是 关联 重 数 标记 ; 它 表示 Deck 中 有 多 
少 Cards。 这 个 数 可 以 是 一 个 简单 的 数字 ， 如 52 ， 或 者 一 个 范围 ， 如 
5. .7 ， 或 者 一 个 星 号 ， 表 示 Deck 可 以 有 任意 数量 的 Card 引 用 。 








图 18-2 中 没有 任何 依赖 和 关系。 依赖 关 通 种 使 用 虚线 箭头 表示 。 或 
者 ， 如 果 有 太 多 的 依 顿 ， 有 时 候 会 忽略 它们 。 


更 详细 的 图 可 能 会 显示 出 Deck 对 象 实际 上 包含 了 一 个 Card 的 列表 
。 但 在 类 图 中 ， 像 列表 、 字 典 这 样 的 内 置 类 型 通常 是 不 显示 的 。 





18.9 ”数据 封装 


前 儿童 展示 了 一 个 我 们 可 以 称 为 “ 面 同 对 象 设计 ”的 开发 计划 。 我 们 
发 现 需要 的 对 象 ， 如 Point 、Rectangle 和 Time， 并 定义 类 来 表达 它 
们 。 每 个 类 都 是 一 个 对 象 到 现实 世界 〈 或 者 最 少 是 数学 世界 ) 中 的 某 种 
实体 的 明显 对 应 。 





但 有 时 候 你 到 底 需要 哪些 对 象 、 它 们 如 何 交 互 ， 并 不 那么 显 而 易 
见 。 这 时 候 你 需要 另 一 种 开发 计划 。 和 之 前 我 们 通过 封装 和 泛 化 来 发 现 
函数 接口 的 方式 相同 ， 我 们 可 以 通过 数据 封装 来 发 现 类 的 接口 。 





13.8 节 提供 了 一 个 很 好 的 示例 。 如 采 从 
http://thinkpython2.com/code/markov.py 下 载 我 的 代码 ， 你 会 发 现 它 使 用 
了 两 个 全 局 变量 (suffix_map 和 prefix ) 并 且 在 多 个 函数 中 进行 读 
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写 。 


suffix map = {} 
prefix = () 


因为 这 些 变量 是 全 局 的 ， 我 们 每 次 只 能 运行 一 个 分 析 。 如 果 我 们 读 
入 两 个 文本 ， 它 们 的 前 级 和 后 缀 就 会 添加 到 相同 的 数据 结构 中 最 后 可 
以 用 来 产生 一 些 有 趣 的 文本 ) 。 








右 要 多 次 运行 分 析 ， 并 保证 它们 之 间 的 独立 ， 我 们 可 以 将 每 次 分 析 
的 状态 信息 封装 成 一 个 对 象 。 下 面 是 它 的 样子 : 


class Markov: 


def _init__(self): 


self.suffix_map = {} 
self.prefix = () 





接 下 来 ， 我 们 将 那些 函数 转换 为 方法 。 例 如 ， 下 面 


是 process_word : 


def process word(self, word, order=2): 
if len(self.prefix) < order: 
self.prefix += (word, ) 
return 


try: 
self.suffix_map[self.prefix].append(word) 
except KeyError: 
# 如 果 这 个 前 级 不 存在 ， 创 建 一 项 
self.suffix_map[self.prefix] = [word] 








self.prefix = shift(self.prefix, word) 








像 这 样 转 换 程 序 
4.771) 的 男 一 个 示例 。 


修改 设计 但 不 修改 其 行为 一 一 是 重 构 参见 





这 个 例子 给 出 了 一 个 设计 对 象 和 方法 的 开发 计划 。 


1. 从 编写 函数 、〔 如 果 需 要 的 话 ) 读 写 全 局 变量 开始 。 





2. 一 旦 你 的 程序 能 够 正确 运行 ， 查 看 全 局 变量 与 使 用 它们 的 函数 
的 关联 。 


3. 将 相关 的 变量 封装 成 为 对 象 的 属性 。 


4. 将 相关 的 函数 转换 为 这 个 新 类 的 方法 。 


作为 练习 ， 从 http://thinkpython2.com/code/markov.py 下 载 我 的 
Markov 人 代码， 并 按照 上 面 描述 的 步骤 将 全 局 变量 封装 为 一 个 叫 
作 Markov 的 新 类 的 属性 。 


解答 : http:Wthinkpython2.comy/code/Markov.py【〈 注 意 M 是 大 与 
的 ) 。 


18.10 “调试 


继承 会 给 调试 带 来 新 的 挑战 ， 因 为 当 你 调用 对 象 的 方法 时 ， 可 能 
法 知道 调用 的 到 底 是 哪个 方法 。 


假设 你 在 编写 一 个 操作 Hand 对 象 的 函数 。 你 可 能 希望 能 够 处 理 所 有 
类 型 的 Hand， 如 PokerHands、BridgeHands 等 。 如 果 你 调用 一 个 方法 ， 
如 shuffle ， 可 能 调用 的 是 Deck 中 定义 的 方法 ， 但 如 果 任 何 子 类 重 载 
了 这 个 方法 ， 则 你 调用 的 会 是 那个 重 载 的 版 本 。 








一 旦 你 无 法 确认 程序 的 运行 流程 ， 最 简单 的 解决 办 法 是 在 相关 的 方 
法 开头 添加 一 个 打印 语句 。 如 果 Deck.shuffle 打印 一 句 Running 
Deck. shuffle 这 样 的 信息 ， 则 当 程 序 运行 时 会 跟踪 运行 的 流程 。 





或 者 ， 你 也 可 以 使 用 下 面 这 个 函数 。 它 接收 一 个 对 象 和 一 个 方法 名 
(字符 串 形式 ) ， 并 返回 提供 这 个 方法 的 定义 的 类 : 


def find defining class(obj, meth_name): 
for ty in type(obj).mro(): 
if meth_name in ty. _ dict : 


return ty 





下 面 是 使 用 的 示例 : 


>>> hand = Hand() 
>>> find defining class(hand, 'shuffle') 


<class 'Card.Deck'> 





所 以 这 个 Hand 对 象 的 shuffle 方法 是 在 Deck 类 中 定义 的 那个 。 


find defining_class 使 用 mro 方法 来 获得 用 于 搜索 调用 方法 的 
类 对 象 〈 类 型 ) 列表 。“MRO” 意 思 是 “method resolution order” (方法 查 
找 顺 序 ) ， 是 Python 解析 方法 名 称 的 时 候 搜索 的 类 的 顺序 。 





一 个 设计 建议 : 每 次 重 载 一 个 方法 时 ， 新 方法 的 接口 应 当 和 旧 方 法 
的 一 致 。 它 应 当 接 收 相 同 的 参数 ， 返 回 相 同 的 类 型 ， 并 服从 同样 的 前 置 
条 件 与 后 置 条 件 。 如 果 遵 循 这 个 规则 ， 你 会 及 现 任何 为 如 Deck 这 样 的 父 
类 设计 的 函数 ， 都 可 以 使 用 Hand 或 PokerHand 这 样 的 子 类 的 实例 。 





如 果 你 破坏 这 个 也 称 为 "Liskov 蔡 代 原 则 ”的 规则 ， 你 的 代码 可 能 会 
像 一 堆 《〈 不 好 意思 ) 纸牌 屋 一 样 骨 塌 。 


18.11 AR 





编码 Cencode) : 使 用 一 个 集合 的 值 来 表示 另 一 个 集合 的 值 ， 需 要 
在 它们 之 则 建立 映射 。 


类 属性 (class attribute) : 关联 到 类 对 象 上 的 属性 。 类 属性 定义 在 
类 定义 之 中 ， 但 在 所 有 方法 定义 之 外 。 





实例 属性 Gnstance attribute) : 和 类 的 实例 关联 的 属性 。 


(iT (veneer) : 一 个 方法 或 函数 ， 它 调用 男 一 个 函数 ， 却 不 做 其 
他 计算 ， 只 是 为 了 提供 不 同 的 接口 。 


继承 Cinheritance) : 可 以 定义 一 个 新 类 ， 它 是 一 个 现 有 的 类 的 修 
改版 本 。 


父 类 (parent class) : 被 子 类 所 继承 的 类 。 


FÆ (child class) : 通过 继承 一 个 现 有 的 类 来 创建 的 新 类 ， 也 叫 
作 “subclass”。 


IS-A 关 联 (IS-A relationship) : 子 类 与 父 类 之 间 的 关联 。 


HAS-A 关 联 (HAS-A relationship) : 两 个 类 之 间 的 一 种 关联 : 一 
个 类 包含 另 一 个 类 的 对 象 的 引用 。 


依赖 (dependency) : 两 个 类 之 则 的 一 种 关联 。 一 个 类 的 实例 使 用 
男 一 个 类 的 实例 ， 但 不 把 它们 作为 属性 存储 起 来 。 





类 图 (class diagram) : 用 来 展示 程序 中 的 类 以 及 它们 之 间 的 关联 
的 图 。 


重 数 (multiplicity) : 类 图 中 的 一 种 标记 方法 ， 对 于 HAS-A 关 联 ， 
用 来 表示 一 个 类 中 有 多 少 对 另 一 个 类 的 对 象 的 引用 。 


数据 封装 (data encapsulation) : 一 个 程序 开发 计划 。 先 使 用 全 局 
变量 来 进行 原型 设计 ， 然 后 将 全 局 变量 转换 为 实例 属性 做 出 最 终 版 本 。 


18.12 练习 


24 >] 18-1 


针对 下 面 的 程序 ， 男 一 张 UML 类 图 ， 展 示 这 些 类 以 及 它们 之 间 的 
关联 : 


class PingPongParent: 
pass 


class Ping(PingPongParent) : 
def _ init__(self, pong): 
self.pong = pong 


class Pong(PingPongParent) : 
def _ init__(self, pings=None): 
if pings is None: 
self.pings = [] 
else: 
self.pings = pings 


def add_ping(self, ping): 
self.pings.append(ping) 


Pong() 
Ping(pong) 
add_ping(ping) 





2 >] 18-2 


编写 一 个 名 为 deal_hands 的 Deck 方 法 ， 接 收 两 个 形 参 : 手 牌 的 数 
量 以 及 每 副手 牌 的 牌 数 。 它 会 根据 形 参 创建 新 的 Hand 对 象 ， 按 照 每 副手 
牌 的 牌 数 出 牌 ， 并 返回 一 个 Hand 对 象 列 表 。 


2 >] 18-3 


下 面 列 出 的 是 扑 苑 牌 中 可 能 的 手 牌 ， 按 照 牌 值 大 小 的 增 序 〈 也 是 可 
能 性 的 降序 ) 排列 。 


。 对 子 (pair) : 两 张 牌 大 小 相同 。 

e 两 对 (two pair) : 两 个 对 子 。 

e 三 条 (three ofa kind) : 三 张 牌 大 小 相同 。 

顺 子 〈straight) : 五 张大 小 相连 的 牌 (Ace 既 可 以 是 最 大 也 可 以 是 
最 小 ， 所 以 Ace-2-3-4-5 是 顺 子 ，10-Jack-Queen-King-Ace 也 是 ， 但 
Queen-King-Ace-2-3 不 是 ) 。 

同 花 (flush) : 五 张 牌 花 色相 同 。 

满堂 红 (full house) : 三 张 牌 大 小 相同 ， 另 外 两 张 牌 大 小 相同 。 
四 条 (four ofa kind) : 四 张 牌 大 小 相同 。 

同花顺 (straight flush) : 顺 子 “如 上 面 的 定义 ) 里 的 五 张 牌 都 是 
花色 相同 的 。 


本 练习 的 目标 是 预测 这 些 手 牌 的 出 牌 概率 。 


1. 从 http:Wthinkpython2.comy/code 下 载 这 些 文件 。 


Card.py: 本 章 中 介绍 的 Card 、Deck 和 Hand 类 的 完整 代码 。 
PokerHand.py : 表达 扑克 手 牌 的 一 个 类 ， 实 现 并 不 完整 ， 包 含 一 
些 测试 它 的 代码 。 





2. 如 果 你 运行 PokerHand .py ， 它 会 连 出 7 组 包含 7 张 卡 片 的 扑克 
手 牌 ， 并 检查 其 中 有 没有 顺 子 。 在 继续 之 前 请 仔细 阅读 代码 。 


3. 在 PokerHand.py 中 添加 方法 has_pair . has_twopair 等 。 
它们 根据 手 牌 是 否 达到 相对 应 的 条 件 来 返回 True 或 False。 你 的 代码 应 当 
对 任意 数量 的 手 牌 都 适用 《虽然 最 常见 的 手 牌 数 是 5 或 7) 。 





4. 编写 一 个 函数 classify (分 类 ) ， 它 可 以 弄 清楚 一 副手 牌 中 出 
现 的 最 大 的 组 合 ， 并 设置 1abel 属性 。 例 如 ， 一 副 7 张 牌 的 手 牌 可 能 
含 一 个 顺 子 以 及 一 个 对 子 ， 它 应 当 标 记 为 “flush”( 顺 子 )。 


5. 当 你 确保 分 类 方法 可 用 时 ， 下 一 步 是 预 训 各 种 手 牌 的 概率 。 
在 PokerHand.py 中 编写 一 个 图 数 ， 对 一 副 牌 进行 洗 牌 ， 将 其 分 成 不 同 
手 牌 ， 对 手 牌 进行 分 类 ， 并 记录 每 种 分 类 出 现 的 次 数 。 


6. 打印 一 个 表格 ， 展 示 各 种 分 类 以 及 它们 的 概率 。 更 多 次 地 运行 
你 的 程序 ， 直 到 输出 收敛 到 一 个 合理 程度 的 正确 性 为 止 。 将 你 的 结果 和 
http://en.wikipedia.org/wiki/ Hand_rankings 上 的 值 进行 对 比 。 


解答 : http://thinkpython2.com/code/PokerHandSoln.py。 


第 19 章 ”Python 拾 珍 


本 书 的 一 大 目标 一 直 是 尽 可 能 少 地 介绍 Python 语言 。 如 果 做 某 种 事 
情 有 两 种 方法 ， 我 会 选择 一 种 ， 并 避免 提 及 力 一 种 。 或 者 有 时 候 ， 我 会 
把 另 一 种 方法 作为 练习 进行 介绍 。 


本 章 我 会 市 领 大 家 回顾 那些 遗漏 的 地 方 。Python 提 供 了 不 少 并 不 是 
完全 必需 的 功能 《不 用 它们 也 能 写 出 好 代码 ) ， 但 有 时 候 ， 使 用 这 些 功 
能 可 以 写 出 更 简洁 、 更 可 读 或 者 更 局 效 的 代码 ， 甚 至 有 时 候 三 者 兼 得 。 


19.1 条 件 表 达 式 


我 们 在 5.4 节 中 见 过 条 件 语句 。 条 件 语 句 通常 用 来 从 两 个 值 中 选择 
一 个 。 例 如 : 
if x > 0: 


y = math.1log(x) 
else: 


y = float('nan') 





这 条 语句 检查 x 是 否 为 正 数 。 如 果 为 正 数 ， 则 计算 math.1og ; 如 
果 为 负数 ，math.1og 会 抛 出 ValueError 异常 。 为 了 避免 程序 停止 
我 们 直接 生成 一 个 “NaN”， 一 个 特殊 的 浮 点 数 ， 代 表 “ 不 是 数 ”(Not A 
Number) 。 


我 们 可 以 用 条 件 表达 式 来 更 简洁 地 写 出 这 条 语句 : 


y = math.log(x) if x > © else float('nan') 


这 条 语句 几乎 可 以 用 喘 语 直接 读 出 来 : “y gets log-x if x is greater 
than 0; otherwise it gets NaN” (Y 的 值 在 x KFO Weemath.log(x), 4 
则 是 NaN ) 。 





递归 函数 有 时 候 可 以 用 条 件 表 达 式 重 写 。 人 例如， 下面 是 factorial 
的 一 个 递归 版 本 : 


def factorial(n): 


if n == 
return 1 
else: 
return n * factorial(n-1) 





我 们 可 以 将 其 重 写 为 : 


def factorial(n): 
return 1 if n == ð else n * factorial(n-1) 





条 件 表达 式 的 另 一 个 用 途 是 处 理 可 选 参数 。 例 如 ， 下 面 是 
GoodKangaroo 的 init 方 法 (参见 练习 17-2) : 


def _ init__(self, name, contents=None): 
self.name = name 
if contents == None: 
contents = [] 
self.pouch_contents = contents 





我 们 可 以 将 其 重 写 为 : 


def _init (self, name, contents=None): 
self.name = name 


self.pouch_contents = [] if contents == None else contents 





一 般 来 说 ， 如 果 条 件 语句 的 两 个 条 件 分 文 都 只 包含 简单 的 返回 或 对 
同一 变量 进行 赋值 的 表达 式 ， 那 么 这 个 语句 可 以 转化 为 条 件 表达 式 。 


19.2 ”列表 理解 


在 10.7 节 中 我 们 已 经 见 过 映射 和 过 滤 模 式 。 例 如 ， 下 面 的 函数 接收 
一 个 字符 串 列 表 ， 将 每 个 元 素 通 过 字符 串 方 法 capitalize 进行 映射 ， 
并 返回 一 个 新 的 字符 串 列 表 。: 


def capitalize _all(t): 
res = [] 
for s int: 


res.append(s.capitalize() ) 
return res 





我 们 可 以 用 列表 理解 (ist comprehension) 把 这 个 函数 写 得 更 紧 


def capitalize all(t): 
return [s.capitalize() for s in t] 


上 面 的 方 括 写 操作 符 说 明 我 们 要 构建 一 个 新 列表 。 方 括 写 之 内 的 表 
达 式 指定 了 列表 的 元 素 ， 而 for 子 句 则 表示 我 们 要 所 历 的 序列 。 





列表 理解 的 语法 有 一 点 粗糙 的 地 方 ， 因 为 里 面 的 循环 变量 ， 即 本 例 
中 的 s ， 在 表达 式 中 出 现在 定义 之 前 。 


列表 理解 也 可 以 用 于 过 小 操作 。 例 如 ， 下 面 的 函数 选择 列表 t 中 的 
大 与 元 素 ， 并 返回 一 个 新 列表 : 


def only_upper(t): 


res = [] 
for s int: 
if s.isupper() 
res.append(s) 
return res 





我 们 可 以 用 列表 理解 将 其 重 写 为 : 


def only_upper(t): 
return [s for s in t if s.isupper()] 


对 于 简单 表达 式 来 说 ， 列 表 理 解 更 紧 浴 、 更 易于 阅读 ， 并 且 它 们 通 
常 都 比 实现 相 同 功能 的 循环 更 快 ， 有 时 候 甚 至 快 很 多 。 因 此 ， 如 果 你 因 
为 我 没有 早 些 提 到 它 而 恼怒 ， 我 表示 十 分 理解 。 





但 是 我 得 辩解 一 下 ， 列 表 理 解 更 难以 调试 ， 因 为 你 没 法 在 循环 内 添 
加 打印 语句 。 我 建议 你 只 在 计算 简单 到 一 次 就 能 卉 对 的 时 候 才 使 用 它 。 
对 于 初学 者 来 说 ， 这 意味 着 从 来 不 用 。 


19.3 Ape eerA IN 


生成 器 表达 式 (generator expression) 和 列表 理解 类 似 ， 但 是 它 使 
用 圆 括号 ， 而 不 是 方 括号 : 





>>> g = (x**2 for x in range(5)) 
g = 人 g 


>> g 
<generator object <genexpr> at 0x7f4c45a786c0> 





ARES PTE ATR, CAE Za EEA. (AE XAMA] 
表 理 解 不 同 ， 它 不 会 一 次 把 结果 都 计算 出 来 ， 而 是 等 待 请求 。 内 置 函 
数 next 会 从 生成 器 中 获取 下 一 个 值 : 
>>> next(g) 
0 


>>> next(g) 
1 





当 到 达 序 列 的 结尾 后 ，next 会 抛 出 一 个 StopIteration 异常 。 可 
以 使 用 for 循环 来 授 历 所 有 值 : 


>>> for val in g: 
print(val) 








+ ae Rese VL AP SINC, Arehfor 循环 会 从 上 一 


个 next MERMERE. AAR Rana, FTI) Ee tesa 
StopException : 


>>> next(g) 
StopIteration 





生成 器 表达 式 经 常 和 sum . max 和 min 之 类 的 函数 配合 使 用 : 


>>> sum(x**2 for x in range(5)) 
30 





19.4 any 和 al1 


Python 提供 了 一 个 内 置 函数 any ， 它 接收 一 个 由 布尔 值 组 成 的 序 
列 ， 并 在 其 中 任何 值 是 True 时 返回 True 。 它 可 以 用 于 列表 : 


>>> any([False, False, True]) 
True 





{BSE is AE ea ASIA TL: 


>>> any(letter == 't' for letter in 'monty') 
True 





上 面 这 个 例子 用 处 不 大 ， 因 为 它 做 的 事情 和 in 表达 式 一 样 。 但 是 
我 们 可 以 用 any 来 重 写 9.3 节 中 的 搜索 函数 。 例 如 ， 我 们 可 以 将 avoids 
函数 重 写 为 : 


def avoids(word, forbidden): 
return not any(letter in forbidden for letter in word) 





17S ph BU ELK J LA AI — 2X: “word avoids forbidden if there are 
not any forbidden letters in word”( 我 们 说 一 个 word 避免 被 禁止 ， 是 
指 word 中 没有 任何 被 禁 的 字母 ) 。 


Python 还 提供 了 男 一 个 内 置 函 数 al1l1 ， 它 在 序列 中 所 有 元 素 都 


是 True 时 返回 True 。 作 为 练习 ， 请 使 用 all 重 写 9.3 节 中 的 uses_all 
函数 。 


19.5 集合 





我 曾 在 13.6 节 中 使 用 字典 来 寻找 在 文档 中 出 现 但 不 属于 一 个 单词 列 
表 的 单词 。 我 写 的 函数 接收 一 个 字典 参数 d1 ， 其 中 包含 文档 中 所 有 的 
单词 作为 键 ; 以 及 另 一 个 参数 d2 ， 包 含 单词 列表 。 它 返回 一 个 字典 ， 
包含 dl 中 所 有 不 在 d2 之 中 的 键 : 








def substract(d1, d2): 
res = dict() 
for key in d1: 
if key not in d2: 


res[key] = None 
return res 





在 这 些 字 典 中 ， 值 都 是 None ， 因 为 我 们 从 来 不 用 它们 。 因 此 ， 我 
们 实际 上 浪费 了 一 些 存储 空间 。 

Python 还 提供 了 另 一 个 内 置 类 型 ， 称 为 集合 (set) ， 它 表现 得 和 
没有 值 而 只 使 用 键 集合 的 字典 类 似 。 向 一 个 集合 添加 元 素 很 快 ， 检 查 集 
合成 员 也 很 快 。 集 合 还 提供 方法 和 操作 符 来 进行 常见 的 集合 操作 。 

例如 ， 集 合 减 法 可 以 使 用 方法 difference 或 者 操作 符 ‘-? RE 
现 。 因 此 我 们 可 以 将 substract 函数 重 写 为 : 


def substract(d1, d2): 
return set(d1) - set(d2) 





结果 是 一 个 集合 而 不 是 字典 ， 但 是 对 于 过 历 之 类 的 操作 ， 表 现 是 一 
样 的 。 


本 书 中 的 一 些 练习 可 以 用 集合 来 更 加 简洁 且 高 效 地 实现 。 例 如 ， 红 
习 10-7 中 的 has_duplicates 函数 ， 下 面 是 使 用 字典 来 实现 的 一 个 解 
答 


Fe 


def has_duplicates(t): 
d = {} 


for x int: 


if x ind: 
return True 
d[x] = True 
return False 





一 个 元 系 第 一 次 出 现 的 时 候 ， 把 它 加 入 到 字典 中 。 如 果 相 同 的 元 素 
再 次 出 现时 ， 函 数 束 返回 True 。 


使 用 集合 ， 我 们 可 以 这 样 写 同 一 个 函数 : 


def has_duplicates(t): 
return len(set(t)) < len(t) 








一 个 元 系 在 一 个 集合 中 只 能 出 现 一 次 ， 所 以 如 果 t 中 间 的 茶 个 元 素 





出 现 超 过 一 次 ， 那 么 变 成 集合 后 其 长 度 会 比 t 小 。 如 果 没 有 任何 重复 元 
素 ， 那 么 集合 的 长 度 应 当 和 t 相同 。 


我 们 也 可 以 使 用 集合 来 解决 第 9 章 中 的 一 些 练习 。 例 如 ， 下 面 
是 uses_only PA BLE HH HFA ARSE LAY WAR : 


def uses_only(word, available): 
for letter in word: 
if letter not in available: 


return False 
return True 











uses only 检查 word 中 所 有 的 字符 是 不 是 在 available 中 出 现 。 
我 们 可 以 这 样 重 写 : 


def uses only(word, available): 
return set(word) <= set(available) 





操作 符 <= 检查 一 个 集合 是 否 是 男 一 个 集合 的 子 集 ， 包 括 两 个 集合 
相等 的 情况 。 这 正好 符合 word 中 所 有 字符 都 出 现在 available 中 。 


19.6 计数 器 


计数 器 (counter) 和 集合 类 似 ， 不 同 之 处 在 于 ， 如 果 一 个 元 素 出 现 
超过 一 次 ， 计 数 器 会 记录 它 出 现 了 多 少 次 。 如 果 你 熟悉 多 重 集 
(multiset〉 这 个 数学 概念 ， 就 会 发 现 计数 器 是 多 重 集 的 一 个 自然 的 表 
JEJ Ts 


计数 器 定义 在 标准 模块 collections 中 ， 所 以 需要 导入 它 再 使 
用 。 可 以 用 字符 串 、 列 表 或 者 其 他 任何 支持 从 代 访问 的 类 型 对 象 来 初始 
化 计数 器 : 
>>> from collections import Counter 


>>> count = Counter('parrot' ) 
>>> count 


Counter({'r':2, 't': 1, 'o': 





计数 器 有 很 多 地 方 和 字典 相似 。 它 们 将 每 个 键 映 射 到 其 出 现 次 数 。 
和 字典 一 样 ， 键 必须 是 可 散 列 的 。 


但 和 字典 不 同 的 是 ， 在 访问 计数 器 中 不 存在 的 元 素 时 ， 它 并 不 会 抛 
出 异 第 。 相 反 ， 它 会 返回 8 : 


>>> count['d'] 
0 


我 们 可 以 使 用 计数 器 来 重 写 练习 10-6 中 的 ijs_anagranm 函数 : 


def is_anagram(word1, word2): 
return Counter(word1) == Counter(word2) 





如 果 两 个 单词 互 为 回 文 ， 则 它们 会 包含 相同 的 字母 ， 且 各 个 字母 的 
计数 相同 ， 所 以 它们 对 应 的 计数 器 对 象 也 会 相等 。 


计数 器 提供 方法 和 操作 符 来 进行 类 似 集 合 的 操作 ， 包 括 集 合 加 法 、 
减法 、 并 集 和 交集 。 计 算 器 还 提供 一 个 非常 常用 的 方法 most_common 
， 它 返回 一 个 值 -频率 对 的 列表 ， 按 照 最 常见 到 最 少见 来 排序 : 











>>> count = Counter('parrot') 
>>> for val, freq in count, most common(3): 
print(val, freq) 





19.7 defaultdict 
collections 模块 还 提供 了 defaultdict ， 它 和 字典 相似 ， 不 同 
的 是 ， 如 果 你 访问 一 个 不 存在 的 键 ， 它 会 自动 创建 一 个 新 值 。 


创建 一 个 defaultdict 对 象 时 ， 需 要 提供 一 个 用 于 创建 新 值 的 函 
数 。 用 来 创建 对 象 的 函数 有 时 被 称 为 工厂 (factory〉 函 数 。 用 于 创建 列 
表 、 集 合 以 及 其 他 类 型 对 象 的 内 置 函 数 ， 都 可 以 用 作 工 三 函数 : 


>>> from collections import defaultdict 
>>> d = defaultdict(list) 


请 注意 ， 参 数 是 1ist 〈 一 个 类 对 象 ) ， 而 不 是 1ist() (一 个 新 的 
列表 ) 。 你 提供 的 函数 直到 访问 不 存在 的 键 时 ， 才 会 被 调用 的 : 





>>> t = d['new key'] 
>>> t 


[] 





新 列表 t 也 会 加 到 字典 中 。 所 以 ， 如 果 我 们 修改 t ， 改 动 也 会 在 d 
中 体现 : 


>>> t.append('new value' ) 
>>> d 


defaultdict(<class ‘list'>, {'new key': [new value']}) 





如 果 创 建 一 个 由 列表 组 成 的 字典 ， 使 用 defaultdict 往往 能 够 帮 
你 写 出 更 简洁 的 代码 。 在 练习 12-2 的 解答 中 ， 我 创建 了 一 个 字典 ， 将 排 
序 的 字母 字符 串 映 射 到 可 以 由 那些 字母 拼写 出 来 的 单词 列表 。 例 
如 ， ‘opst' 映射 到 列表 [ "opts'， 'post', 'pots', ‘spot’, 
‘stop', ‘tops']. ALAM 
http://thinkpython2.com/code/anagram_sets.py 下 载 该 解答 。 


下 面 是 原始 的 代码 : 


def all_anagrams(filename): 
d = {} 
for line in open(filename): 
word = line.strip().lower() 
t = signature(word) 
if t not in d: 


d[t] = [word] 
else: 
d[t].append(word) 
return d 





这 个 函数 可 以 用 setdefault 简化 ， 你 可 能 在 练习 11-2 中 也 用 过 : 


def all_anagrams(filename): 
d = {} 
for line in open(filename): 
word = line.strip().lower() 


t = signature(word) 
d.setdefault(t, []).append(word) 
return d 








但 这 个 解决 方案 有 一 个 缺点 ， 它 不 管 是 人 否 需 要 ， 每 次 都 会 新 建 一 个 
列表 。 对 于 列表 来 说 ， 这 并 不 算 大 问题 ， 但 如 末 工 三 函数 非常 复杂 ， 束 





有 可 能 成 为 问题 了 。 


我 们 可 以 使 用 defaultdict 来 避免 这 个 问题 ， 并 进一步 简化 代 
码 : 


def all_anagrams(filename): 
d = defaultdict(list) 
for line in open(filename): 
word = line.strip().lower() 


t = signature(word) 
d[t]. append(word) 
return d 





在 练习 18-3 的 解答 中 ， 函 数 has_straightflush 中 使 用 了 
setdefault 。 可 以 从 http:/ thinkpython2.com/code/PokerHandSoln.py 下 
载 它 。 但 这 个 解雇 方案 的 缺点 是 ， 不 管 是 人 否 必需 ， 每 次 循环 和 友 代 都 会 创 
建 一 个 新 的 Hand 对 象 。 作 为 练习 ， 请 使 用 defaultdict 重 写 该 函数 。 





19.8 ”命名 元 组 


很 多 简单 的 对 象 其 实 都 可 以 看 作 是 几 个 相关 值 的 集合 。 例 如 ， 第 15 
章 中 定义 的 Point 对 象 ， 包 含 两 个 数字 ， 即 x Ally. ae 文 样 的 类 
时 ， 通 常会 从 init 方法 和 str 方法 开始 : 


class Point: 


def _ init (self, x=0, y=0): 
self.x = x 
self.y = y 


def _str (self,): 
return '(%g, %g)' % (self.x, self.y) 





这 里 用 -> 很 多 代码 来 传达 很 少 的 信息 。Python 提 供 了 一 个 更 简洁 的 
方式 来 表达 同一 个 意思 : 


from collections import namedtuple 
Point = namedtuple('Point', ['x', 'y']) 





ee 要 创建 的 类 名 。 第 二 个 参数 是 Point 对 象 应 当 包含 
的 属性 的 列表 ， 以 字符 串 表 示 。namedtuple 的 返回 值 是 一 个 类 对 象 : 


>>> Point 
<class ' main .Point'> 





这 里 Point 类 会 自动 提供 ” init 和 str _ 这 样 的 方法 ， 所 以 你 


不 需要 写 它 们 。 


要 创建 一 个 Point 对 象 ， 可 以 把 Point 类 当 作 函数 来 用 : 


>>> p = Point(1, 2) 


>>> p 
Point(x=1, y=2) 








init 方法 使 用 你 提供 的 名 字 把 实 参 值 赋 给 属性 。str 方法 会 打印 
出 Point 对 象 及 其 属性 的 字符 串 表示 。 


可 以 使 用 名 称 来 访问 命名 元 组 的 元 素 : 








命名 元 组 提供 了 快速 定义 简单 类 的 方法 ， 但 其 缺点 是 简单 的 类 并 不 
会 总 保持 简单 。 可 能 之 后 你 需要 给 命名 元 组 添加 方法 。 如 采 那 样 ， 可 以 





定义 一 个 新 类 ， 继 承 当 前 的 命名 元 组 : 


class Pointier(Point): 





# 在 这 里 添加 更 多 的 方法 





或 者 也 可 以 直接 切换 成 传统 的 类 定义 。 


19.9 ”收集 关键 词 参数 


在 12.4 节 中 ， 我 们 见 过 如 何 编写 函数 将 其 参数 收集 成 一 个 元 组 : 


def printall(*args): 
print(args) 





可 以 使 用 任意 个 数 的 按 位 实 参 〈 也 就 是 说 ， 不 带 名称 的 实 参 ) 来 调 
用 这 个 函数 : 


>>> printall(1, 2.0, '3') 
(1, 2.0, '3') 





但 是 * 写 操作 符 并 不 会 收集 关键 词 实 参 : 


>>> printall(1, 2.0, third='3') 
TypeError: printall() got an unexpected keyword argument ‘third’ 





要 收集 关键 词 实 参 ， 可 以 使 用 ** 操 作 符 : 


def printall(*args, **kwargs): 
print(args, kwargs) 





这 里 收集 关键 词 形 参 可 以 任意 命名 ， 但 kwargs 是 一 个 常见 的 选 
择 。 收 集 的 结果 是 一 个 将 关键 词 映 射 到 值 的 字典 : 


>>> printall(1, 2.0, third='3') 
(1, 2.0){'third': '3'} 





如 果 有 一 个 关键 词 到 值 的 字典 ， 就 可 以 使 用 分 散 操作 符 **# 来 调用 
函数 : 
>>> d = dict(x=1, y=2) 


>>> Point(**d) 
Point(x=1, y=2) 





没有 用 分 散 操作 符 的 话 ， 函 数 会 把 d 当 作 一 个 单独 的 按 位 实 参 ， 所 
以 它 会 把 d 赋值 给 x ， 并 因为 没有 提供 y 的 赋值 而 报错 : 


>>> d = dict(x=1, y=2) 

>>> Point(d) 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


TypeError: _new () missing 1 required positional argument: 'y' 








当 处 理 参 数 很 多 的 函数 时 ， 创 建 和 传递 字典 来 指定 第 用 的 选项 是 非 
常 有 用 的 。 


19.10 术语 表 


条 件 表 达 式 (conditional expression) : 一 个 根据 条 件 返 回 一 个 或 
两 个 值 的 表达 式 。 


列表 理解 (list comprehension) : 一 个 以 方 框 包含 一 个 for 循环 ， 
生成 新 列表 的 表达 式 。 


生成 喜 表 达 式 (generator expression) : 一 个 以 括号 包含 一 个 for 
循环 ， 返 回 一 个 生成 器 对 象 的 表达 式 。 

ZER (multiset) : 一 个 用 来 表达 从 一 个 集合 的 元 素 到 它们 出 现 
次 数 的 映射 的 数学 概念 。 


工厂 函数 (factory): 一 个 用 来 创建 对 象 ， 并 常常 当 作 参 数 使 用 的 
函数 。 


19.11 练习 


练习 19-1 





下 面 的 函数 可 以 递归 地 计算 二 项 式 系数 : 
binomial_coeff(n, k): 
""" 计 算 (n，Kk) 的 二 项 式 系数 . 


n: 试验 次 数 
k: 成 功 次 数 





返 


if k == 0: 
return 1 

if n == @: 
return @ 


res = binomial_coeff(n-1, k) + binomial_coeff(n-1, k-1) 
return res 
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注意 : 这 个 函数 效率 不 高 ， 因 为 它 会 不 停 地 重复 计算 相同 的 值 。 可 
以 通过 使 用 备 筷 (memoizing, 211.677) 来 提高 它 的 效率 。 但 你 可 
能 会 发 现 ， 使 用 条 件 表 达 式 之 后 ， 添 加 备 瑟 会 变 得 比较 困难 。 





第 20 章 ”调试 


调试 程序 时 ， 应 当 区 分 不 同类 型 的 错误 ， 以 便 更 快 地 查找 出 错误 原 


语法 错误 (semantic error) 在 将 源 代 码 翻译 为 字 节 码 的 过 程 中 由 解 
释 器 发现 。 它 们 通常 表示 有 程序 结构 错误 。 例 如 ， 在 def 语句 的 末 
尾 漏 擅 冒 写 ， 会 产生 一 个 有 些 见 余 的 错误 信息 SyntaxError: 
invalid syntax 。 
运行 时 错误 (runtime error) 由 解释 器 在 程序 运行 的 过 程 中 发 现 错 
误 后 产生 。 大 部 分 错误 消 息 都 包含 了 错误 发 生 的 位 置 以 及 正在 执行 
的 函数 的 信息 。 例 如 : 一 个 无 限 递归 最 终 会 导致 运行 时 错误 
maximum recursion depth exceeded CHIRK ŚR) 。 
语义 错误 (semantic error) 是 程序 运行 中 没有 产生 错误 信息 ， 但 做 
的 事情 却 不 正确 的 情况 。 例 如 : 一 个 表达 式 求 值 的 顺序 和 你 预想 的 
不 同 ， 因 此 产生 了 不 正确 的 结 














调试 的 第 一 步 就 是 弄 清楚 你 面 对 的 到 底 是 哪 种 类 型 的 错误 。 昌 然 下 


面 的 几 节 是 按照 错误 类 型 来 组 织 的 ， 但 有 些 技巧 其 实 可 以 适用 于 多 种 情 
形 。 


20.1 语法 错误 





语法 错误 ， 在 弄 清楚 它们 是 什么 之 后 ， 通 常 都 很 容易 修正 。 不 幸 的 
是 ， 错 误 信息 往往 没什么 帮助 。 最 常见 的 错误 信息 是 SyntaxError: 
invalid syntax 和 SyntaxError: invalid token ， 这 两 种 都 没 多 
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另 一 方面 ， 信 息 也 确实 告诉 你 问题 在 程序 中 发 生 的 位 置 。 实 际 上 ， 
它 告 诉 你 的 是 Python 及 现 错误 的 位 置 ， 而 并 不 一 定 总 和 错误 发 生 的 位 置 
相同 。 有 时 候 错 误 发 生 在 错误 信息 指明 的 位 置 之 前 ， 往 往 是 前 一 行 。 


如 果 你 递增 地 构建 程序 ， 应 当 很 清楚 错误 发 生 的 位 置 。 它 常常 在 你 
最 后 添加 的 那 行 代码 上 。 





如 果 你 是 从 书本 中 复制 代码 ， 则 最 好 先 仔 细 比 较 目 己 的 代码 和 书 中 
的 代码 。 检 查 每 一 个 字母 。 同 时 请 记得 书本 也 可 能 是 错 的 ， 所 以 如 果 你 
看 到 一 个 像 是 语法 错误 的 东西 ， 那 么 它 有 可 能 就 是 。 


下 面 是 一 些 可 以 避免 最 常见 的 语法 错误 的 方法 。 





1. 确保 你 没有 使 用 Python 关 键 字 作为 变量 名 称 。 


2. 检查 在 每 一 个 复合 语句 的 语句 头 结尾 ， 都 有 一 个 冒号 ， 包 括 for 
. while, if 和 def 语句 。 


3. 确保 程序 中 每 个 字符 串 都 有 前 后 匹配 的 引号 。 确 定 每 个 括号 都 
征 直 引 号 〈 如 ") ， 而 不 是 弯 引 号 《如 ”) 。 





4. 如 有 果 有 三 引 写 〈 单 引号 或 双 引 号 字符 多 行 字 符 串 ， 确 保 你 正 
确 结束 了 字符 串 。 没 有 正确 结束 的 字符 串 ， 会 导致 程序 结尾 处 产 
生 invalid token 错误 ， 或 者 它 会 将 接 下 来 的 程序 看 作 字 符 串 的 一 部 
分 ， 直 到 遇 到 下 一 个 字符 串 为 止 。 这 种 情况 下 ， 可 能 都 不 会 产生 错误 信 
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5. 没有 关闭 的 开始 符号 〈(、{ 或 [ ) 会 让 Python 继续 解析 下 一 
行 ， 并 当 作 当前 语句 的 一 部 分 。 通 常 来 说 ， 会 在 下 一 行 立 即 产生 一 个 错 


6. 检查 在 条 件 判断 时 将 “==:' 写 成 “= 的 经 典 错误 。 


7. 检查 缩 进 ， 确 保 它 们 是 按照 设想 正确 排 布 的 。Python 可 以 处 理 
空格 和 制 表 符 ， 但 如 果 混 合 使 用 它们 ， 则 可 能 产生 问题 。 避 免 这 种 问题 
最 好 的 办 法 是 使 用 一 个 懂得 Python 的 编辑 器 ， 并 由 它 产 生 一 致 的 缩 进 。 





8. 如果 你 的 代码 中 有 非 ASCII 字 符 〈 包 括 字 符 串 和 注释 中 ) ， 虽 然 
Python 3 通 钊 能 处 理 好 非 ASCII 字 符 ， 但 还 是 可 能 导致 问题 。 当 你 从 网 页 
或 其 他 来 源 直 接 复制 文本 时 ， 需 要 格外 注意 。 





如 打上 面 的 办 法 都 疫 用 ， 请 继续 看 下 一 节 。 





我 一 直 进 行 修 改 ， 但 没有 什么 区 别 


如 果 解 释 融 报 出 一 个 错误 而 你 又 找 不 到 ， 有 可 能 是 因为 解释 器 和 你 
用 的 并 不 是 同一 套 代码 。 检 查 你 的 编程 环境 ， 确 保 你 正在 编辑 的 代码 和 
Python 运行 的 是 同一 个 。 
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运行 一 次 。 如 宁 解 释 器 并 没有 发 现 新 的 错误 ， 那 么 次 明 你 运行 的 不 是 新 
代码 。 





可 能 有 以 下 几 种 原因 。 








。 你 编辑 了 代码 ， 但 忘 了 保存 更 改 就 直接 运行 了 。 有 的 编程 环境 会 帮 
你 自动 保存 ， 有 的 不 会 。 

。 你 修改 了 文件 名 ， 但 仍然 在 使 用 旧 文 件 名 运行 程序 。 

。 你 的 编程 环境 可 能 没有 正确 配置 。 

。 如 果 你 在 编写 一 个 模块 ， 并 使 用 import ， 请 确保 你 的 模块 名 称 没 
有 和 Python 标 准 模 块 冲突 。 

。 如 有 果 你 在 使 用 import 来 读 入 模块 ， 请 记得 重 载 一 个 修改 过 的 文件 
时 ， 需 要 重启 解释 器 或 者 使 用 reload 。 如 果 你 直接 重新 导入 这 个 
模块 ， 它 并 不 会 做 任何 事 。 











如 果 你 遇 到 困难 被 卡 住 ， 而 且 弄 不 清楚 到 底 怎 么 回 事 ， 一 个 办 法 是 
重新 以 最 简单 的 类 似 “Hello，World! ”的 程序 开始 ， 并 确保 你 能 让 一 个 
己 知 的 程序 正确 运行 。 然 后 逐渐 添加 原先 程序 的 部 分 到 新 的 程序 中 。 





20.2 ”运行 时 错误 





一 旦 你 的 程序 已 经 确保 语法 正确 ，Python 可 以 读 它 ， 并 且 人 至少 可 以 
开始 运行 它 。 这 时 候 可 能 发 生 哪 些 错误 ? 


20.2.1 我 的 程序 什么 都 不 做 


这 个 问题 最 第 见 的 原因 是 你 的 文件 包含 了 各 种 函数 和 类 的 定义 ， 但 
没有 实际 调用 函数 来 启动 执行 。 如 果 你 是 为 了 导入 模块 使 用 它们 提供 的 
类 和 函数 ， 那 么 这 么 做 可 能 是 故意 的 。 








如 果 不 是 故意 的 ， 则 确保 在 程序 中 有 一 个 函数 调用 ， 并 确保 执行 流 
程 能 到 达 这 一 函数 调用 A 20.2.57) 。 


20.2.2 ”我 的 程序 卡 死 了 


如 采 一 个 程序 突然 停止 并 看 起 来 什么 事情 都 没 做 ， 它 就 “ 卡 死 了 ”。 
通常 这 意味 着 程序 卸 入 一 个 死 循环 或 者 无 限 递归 中 。 





。 如 宁 怀 疑 一 个 特别 的 循环 可 能 是 问题 所 在 ， 可 以 在 循环 开始 前 添加 
一 个 print 语句 ， 打 出 “进入 循环 ”， 在 循环 结尾 处 之 后 也 添加 一 
个 ， 打 出 “退出 循环 ”。 





再 次 运行 程序 。 如 果 你 看 到 第 一 个 输出 ， 而 没有 看 到 第 二 个 ， 说 明 
你 确实 遇 到 一 个 死 循 环 了 。 无 限 循环 的 内 容 参 见 20.2.3 节 。 


。 大 部 分 情况 下 ， 无 限 递归 都 会 让 程序 运行 一 会 儿 ， 然 后 产 


生 “RuntimeError: Maximum recursion depth exceeded” 错 误 。 如 果 发 


生 这 种 情况 ， 参 见 20.2.4 节 。 








如 果 你 没有 看 到 这 个 错误 ， 但 怀疑 可 能 是 递归 方法 或 函数 产生 的 问 
题 ， 也 同样 可 以 使 用 20.2.4 节 中 的 技巧 。 


。 如 果 上 面 两 步 都 没 用 ， 党 试 其 他 循环 或 其 他 递归 方法 与 函数 。 
。 如 果 这 些 都 没 用 ， 说 明 可 能 是 你 没 理解 你 的 程序 的 执行 流程 。 执 行 
流程 的 内 容 参见 20.2.5 节 。 


20.2.3 ”无限 循环 


如 果 你 觉得 有 一 个 无 限 循环 并 知道 是 哪个 循环 导致 的 问题 ， 可 以 在 
循环 的 结尾 处 添加 一 个 print 语句 ， 打 印 出 循环 条 件 中 的 变量 值 ， 以 及 
条 件 的 值 。 


例如 : 


while x > @ andy < @: 
# do something to x 
# do something to y 


print('x: ', 


print('y: ', 
print("condition: ", (x > © and y < @)) 








现在 当 你 再 次 运行 程序 时 ， 能 够 看 到 每 次 循环 中 打印 出 的 3 行 输 
出 。 最 后 一 次 循环 时 ， 条 件 应 该 变 为 False 。 如 果 循 环 一 直 进 行 ， 你 应 
当 可 以 看 到 x 和 y 的 值 ， 并 可 能 弄 清 楚 为 什么 它们 没有 说 正确 更 新 。 


20.2.4 无 限 递归 





大 部 分 情况 下 ， 无 限 递归 会 导致 程序 运行 一 会 儿 ， 然 后 产 


生 Maximum recursion depth exceeded 的 错误 。 





如 果 你 怀疑 一 个 函数 导致 了 无 限 递 归 ， 保 证 递归 确实 有 一 个 基准 情 
形 。 应 该 有 一 个 条 件 能 导致 冰 数 直接 返回 而 不 再 继续 递归 调用 。 如 果 没 
有 ， 那 么 你 可 能 需要 重新 思考 算法 ， 并 定位 一 个 基准 情形 。 








如 果 有 一 个 基准 情形 ， 但 程序 似乎 没有 到 达 它 ， 可 以 在 函数 的 开头 
加 一 个 print 语句 来 打印 参数 。 现 在 当 你 重新 运行 程序 时 ， 会 看 到 每 次 
函数 调用 时 都 会 打出 几 行 输出 ， 并 能 看 到 每 次 调用 的 参数 值 。 如 果 参 数 
并 没有 回 基 准 情 形变 化 ， 你 大 概 能 发 现 为 何如 此 。 


20.2.5 ”执行 流程 





如 果 你 不 确认 程序 中 的 执行 流程 如 何 走 向 ， 可 以 在 每 个 函数 的 开头 
添加 一 个 print 语句 ， 打 印 类 似 “ 进 入 函数 foo ”之 类 的 输出 。 这 里 foo 
是 函数 名 。 


现在 如 果 你 重新 运行 程序 ， 它 会 打印 出 每 个 函数 调用 的 轨迹 。 
20.2.6 ” 当 我 运行 程序 ， 会 得 到 一 个 异常 


如 果 在 运行 时 直到 一 个 问题 ，Python 会 打印 出 一 个 信息 ， 包 含 错误 
的 名 称 ， 程 序 中 发 生 这 个 错误 的 位 置 ， 以 及 一 个 回 漳 。 


回溯 里 标明 了 当前 执行 的 函数 ， 以 及 调用 它 的 函数 ， 以 及 调用 这 个 
调用 者 的 函数 ， 依 此 类 推 。 换 名 话说 ， 它 回溯 了 从 程序 开头 直到 错误 发 
生 所 在 位 置 的 整个 调用 轨迹 ， 包 括 了 每 个 函数 所 在 文件 中 的 行 号 。 





第 一 步 是 检查 程序 中 错误 发 生 的 位 置 ， 并 尝试 弄 清楚 问题 所 在 。 下 
面 是 一 些 第 见 的 运行 时 错误 。 


NamekError 





你 在 试图 使 用 一 个 当前 环境 中 并 不 存在 的 变量 。 检 查 变 量 名 是 否 有 
拼写 正确 ， 或 至 少 是 一 致 。 请 记得 局 部 变量 是 局 部 的 ， 不 能 在 定义 它们 
的 函数 之 外 使 用 。 











TypeError 


有 3 种 可 能 的 原因 。 





。 你 在 尝试 错误 地 使 用 一 个 值 。 例 如 ， 使 用 不 是 整数 的 值 来 索引 字符 
串 、 列 表 或 元 组 。 

。 格式 字符 串 中 ， 内 部 的 格式 项 和 传 入 的 参数 不 匹配 。 当 格式 项 的 数 
目 不 对 或 者 转换 的 类 型 不 对 时 部 可 能 发 生 。 

。 调用 函数 时 使 用 了 错误 数量 的 参数 。 对 于 方法 来 说 ， 奉 看 方法 定义 
并 检查 第 一 个 参数 是 否 为 self 。 接 着 查看 方法 调用 ; 确保 你 是 在 
正确 类 型 的 对 象 上 调用 方法 ， 并 正确 提供 了 其 他 参数 。 


KeyError 


你 在 试图 用 一 个 字典 并 不 包含 的 键 来 得 找 字 典 的 元 素 。 如 采 键 是 字 
符 串 ， 请 注意 大 小 写 问题 。 


AttributeError 





你 在 笃 试 访问 一 个 并 不 存在 的 属性 或 方法 。 检 查 拼写 ! 你 可 以 使 用 


内 置 的 vars 函数 来 列 出 存在 的 属性 。 





如 果 AttributeError 指 明 一 个 对 象 是 NoneType ， 则 意味 着 它 是 None 
。 那 么 问题 不 是 属性 名 而 是 对 象 。 





对 象 为 None 的 原因 可 能 是 你 筷 了 从 函数 里 返回 值 ， 如 果 函 数 执行 到 
结尾 都 没有 遇 到 return 语句 ， 那 么 它 会 返回 None 。 另 一 个 常见 的 原因 
是 使 用 了 一 个 返回 None 的 列表 方法 作为 结果 ， 如 sort 。 


IndexError 

你 在 访问 列表 、 字 符 串 或 元 组 时 使 用 的 索引 大 于 它 的 长 度 减 一 。 在 
昔 误 发 生 的 前 一 行 ， 添 加 一 个 print 语句 展示 索引 的 值 和 数组 的 长 度 。 
数组 长 度 是 否 正 确 ? 索引 大 小 是 否 正确 ? 

Python 调试 器 (pdb) 在 查找 异常 时 很 有 用 ， 因 为 它 让 你 可 以 在 错 


误 发 生 之 前 的 地 方 查看 程序 的 状态 。 可 以 在 
http://docs.python.org/3/library/pdb. html iJ pdb 的 相关 资料 。 





20.2.7 我 添加 了 太 多 print 语句 ， 被 输出 淹没 了 

使 用 print 语句 进行 调试 的 问题 之 一 是 你 可 能 被 太 多 的 输出 所 埋 
没 。 有 两 种 方法 可 以 继续 : 简化 输出 ， 或 者 简化 程序 。 

要 简化 输出 ， 可 以 删除 或 注释 掉 没 用 的 print 语句 ， 或 者 将 它们 合 
并 起 来 ， 或 者 格式 化 输出 让 它们 更 容易 看 懂 。 





要 简化 程序 ， 有 几 件 事 情 可 做 。 首 先 ， 简 化 程序 所 处 理 的 问题 。 例 





OH, MWMRRERR -TIR MANR ZR MIRADA 列表 。 如 果 程 序 
从 用 户 获得 输入 ， 则 输入 可 以 产生 错误 的 最 简单 的 输入 。 


其 次 ， 清 理 程序 。 删 除 无 效 代 码 ， 并 重新 组 织 代 码 让 它 尽 可 能 更 可 
读 。 例 如 ， 如 宁 你 怀疑 问题 出 在 程序 的 一 个 很 深 的 舱 套 部 分 中 ， 则 应 当 
尝试 重 写 屠 部分， 让 它 的 结构 更 简单 。 如 果 你 怀疑 一 个 很 大 的 函数 ， 则 
尝试 将 它 拆 分 为 多 个 更 小 的 函数 ， 并 分 别 测试 它们 。 


找寻 最 简 测试 用 例 的 过 程 往往 能 带 你 找到 问题 所 在 。 如 果 发 现 程序 
在 一 种 情况 下 正常 工作 ， 而 在 兄 一 种 情况 下 则 不 能 ， 那 这 些 情况 本 喘 网 
给 你 一 些 线索 。 


类 似 地 ， 重 写 一 部 分 代码 可 以 帮 你 找到 细微 的 bug。 如 果 你 做 出 一 
个 认为 不 该 影响 程序 的 改变 ， 而 它 确实 出 问题 了 ， 这 就 给 了 具体 的 提 
ZR o 





20.3 if fiz 





NAPA, AEREE AA ARE ARIE AS Ge BEE (AI is 
恩 。 只 有 你 自己 知道 程序 到 底 应 该 上 怎么 做 。 











解决 语义 错误 的 第 一 步 是 在 程序 文本 和 你 看 到 的 程序 行为 之 间 建 立 
一 个 连接 。 你 需要 对 程序 实际 在 做 什么 有 一 个 假设 。 让 这 件 事情 很 难 的 
原因 之 一 是 计算 机 运行 得 太 快 。 














你 常 币 会 布 望 程序 能 够 减 慢 到 人 的 速度 ， 而 使 用 调试 器 时 你 可 以 做 
到 。 但 往 程 序 里 插入 几 条 精确 放置 的 print 语句 ， 比 起 设置 调试 器 ， 插 
入 或 删除 断 点 ， 并 * 单 步 ? 执 行 到 程序 出 错 的 地 方 ， 往 往 花费 的 时 间 更 


少 。 








20.3.1 我 的 程序 运行 不 正确 





你 应 该 问 自己 如 下 几 个 问题 。 





。 程序 中 有 没有 地 方 你 期 望 它 去 做 而 实际 上 没有 及 生 的 ? 找到 运行 那 
段 功 能 的 代码 ， 并 确保 它 确 实 如 你 所 期 望 的 那样 运行 了 。 

。 有 没有 一 些 不 应 该 发 生 的 事情 ? 找到 程序 中 运行 了 茶 种 不 该 出 现 的 
功能 的 代码 。 

。 有 没有 一 段 代 码 产 生 的 效果 和 你 所 期 望 的 不 一 致 ?确保 你 完全 明日 
该 段 代 码 ， 特 别 是 当 它 牵涉 到 其 他 Python 模块 的 函数 或 方法 时 。 阅 
读 你 调用 的 函数 的 文档 。 使 用 简单 的 测试 用 例 测 试 它们 并 检 枉 结 
果 。 








为 了 能 够 编程 ， 你 需要 程序 如 何 工 作 的 一 个 思维 模型 。 如 果 编 写 出 
一 段 和 你 预期 不 同 的 代码 ， 常 党 问题 不 是 在 程序 本 映 ， 而 是 在 你 的 忠 维 
模型 上 。 





修正 你 的 思维 模型 的 最 佳 方法 是 将 程序 划分 成 不 同 部 分 〈 通 毅 是 函 
数 和 方法 ) 并 独立 测试 每 一 个 部 分 。 一 旦 找到 你 的 模型 和 真实 世界 的 偏 
Ze, LAE WS ER E jel To 


当然 ， 在 开发 程序 时 你 应 当 分 组 件 进行 构建 和 测试 。 如 果 发 现 一 个 
问题 ， 应 该 只 需要 检查 一 小 部 新 的 不 确认 是 人 否 正确 的 代码 。 
20.3.2 ”我 有 一 个 巨大 而 复杂 的 表达 式 ， 而 它 和 我 预料 的 不 同 


编写 复杂 的 表达 式 并 没有 问题 ， 只 要 能 保证 它们 还 可 读 。 但 它们 也 
会 变 得 更 难 调试 。 将 复杂 的 表达 式 拆 分 成 一 系列 的 赋值 到 临时 变量 的 语 


得 
句 ， 常 党 是 个 好 主意 。 


例如 : 


self.hands[i].addCard(self.hands[self.findNeighbor(i)].popCard()) 


这 个 表达 式 可 以 写作 : 


neighbor = self.findNeighbor (i) 
pickedCard = self.hands[neighbor ].popCard() 


self.hands[i].addCard(pickedCard) 





后 面 更 清晰 的 版 本 也 更 加 可 读 ， 因 为 变量 名 称 提 供 了 附加 的 文档 信 


恩 ， 它 也 更 加 容易 调试 ， 因 为 你 可 以 检查 中 间 变 量 的 类 型 ， 并 打印 它们 
的 值 。 


复杂 表达 式 的 另 一 个 问题 是 求 值 的 顺序 可 能 和 你 所 期 望 的 不 同 。 例 
如 ， 如 果 你 将 表达 式 x /2r 翻 译 成 Python， 可 能 会 这 么 写 


dn 


y =x / 2 * math.pi 


这 样 并 不 正确 ， 因 为 乘法 和 除法 有 相同 的 优先 级 ， 并 且 语 句 求 值 的 
顺序 是 从 左 至 右 。 所 以 这 个 表达 式 计 算 的 实际 上 是 x 11/2. 











调试 表达 式 的 一 个 好 办 法 是 添加 括号 来 显 式 控制 求 值 顺序 : 


y =x / (2 * math.pi) 


任何 时 候 如 采 不 确定 求 值 的 顺序 ， 都 可 以 使 用 括号 。 这 样 不 但 会 让 
程序 更 加 正确 《从 按照 你 的 设想 来 做 的 角度 说 ) ， 也 会 让 其 他 人 更 容易 
阅读 你 的 代码 ， 因 为 不 需要 去 记忆 操作 的 顺序 。 


20.3.3 ”我 有 一 个 函数 ， 返 回 值 和 预期 不 同 


如 果 你 在 程序 中 有 return 语句 返回 一 个 复杂 的 表达 式 ， 则 没有 机 
会 在 返回 之 前 打印 结果 。 这 时 候 ， 也 可 以 使 用 临时 变量 。 例 如 ， 这 个 语 








return self.hands[i].removeMatches() 


Hy 


可 以 写作 : 


count = self.hands[i].removeMatches() 
return count 


现在 你 有 机 会 在 返回 之 前 显示 count 的 值 了 。 
20.3.4 我 真 的 真 的 卡 住 了 ， 我 需要 帮助 


首先 ， 试 着 离开 计算 机 几 分 钟 。 计 算 机 会 发 射 辐射 影响 大 脑 ， 产 生 
下 列 症 状 。 








。 AICI AL TRI 

。 迷信 的 信念 (“我 的 计算 机 恨 我 *) 和 神奇 的 想法 (“程序 只 有 在 我 
反 戴 帽子 时 才 正 确 运 行 >) 。 

。 随机 行走 编程 (尝试 着 写 下 所 有 可 能 的 程序 ， 并 选择 运行 正确 的 那 


de 








如 果 你 发 现 目 己 正在 遭受 这 些 症状 之 一 ， 请 马上 站 起 来 出 去 散 个 
步 。 当 你 平静 下 来 后 ， 再 思考 程序 。 它 在 做 什么 ? 产生 那 种 行为 的 可 能 
原因 有 哪些 ? 上 一 次 程序 还 正确 运行 是 什么 时 候 ， 之 后 你 做 了 什么 ? 














有 时 候 发 现 一 个 bug 确 实 需要 时 间 。 我 冲 利 能 够 在 远离 计算 机 并 让 
思维 休 乱 之 后 找到 bug。 找 到 错误 的 最 佳 地 点 有 火车 上 、 浴 和 中 及 将 要 
入 睡 之 前 在 床上 。 


20.3.5 不行， 我 真 的 需要 帮助 








这 种 事 确 实 会 有 发生。 即使 最 好 的 程序 员 也 会 偶尔 卡 住 。 有 时 候 你 在 
一 段 程序 上 工作 太 久 了 所 以 反而 看 不 到 错误 。 你 需要 一 双 新 的 眼睛 。 


在 叫 人 帮忙 之 前 ， 请 确保 你 已 经 准备 好 。 你 的 程序 应 当 尽 量 简单 ， 
而 你 应 当 使 用 最 小 的 输入 来 复 现 错误 。 你 应 当 在 合适 的 地 方 放 好 了 
print 语句 《并 且 它 们 的 输出 应 当 容 易 理 解 ) 。 你 应 当 足 够 理解 这 个 问 
题 ， 因 此 能 够 简明 扼要 地 描述 它 。 








当 你 找 人 帮忙 时 ， 请 确保 给 他 们 需要 的 信息 。 





。 如 果 有 错误 信息 ， 它 是 什么 ， 它 代表 了 程序 的 哪 部 分 ? 

。 在 这 个 错误 发 生 之 前 ， 你 做 的 最 后 一 件 事 情 是 什么 ? 你 写 的 最 后 一 
段 代 码 是 什么 ? 失败 的 新 测试 用 例 是 什么 ? 

。 目前 为 止 你 做 了 哪些 尝试 ， 并 从 中 得 到 了 什么 ? 











当 你 找寻 bug 时 ， 思 考 一 下 如 何 做 才能 找 得 更 快 。 下 一 次 见 到 类 似 
的 情形 时 ， 就 能 够 更 快 地 找到 问题 了 。 











记 住 ， 目 标 不 只 是 让 程序 正确 运行 。 目 标 是 学 会 如 何 让 程序 正确 运 
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1X Bae 426 AO’ Reilly Media 出 版 的 Allen B. Downey 的 Think 
Complexity (2012) 一 书 。 当 你 读 完 本 书 之 后 ， 可 能 会 想 继续 读 那 本 
“ite 





算法 分 析 是 计算 机 科学 的 一 个 分 文 ， 研 完 算 法 的 性 能 ， 尤 其 是 它 
们 的 运行 时 间 和 空间 需求 。 参 见 
http://en.wikipedia.org/wiki/Analysis_of_algorithms. 


算法 分 析 的 实践 目标 是 预测 不 同 算法 的 性 能 ， 以 便于 指导 设计 决 
Wo 





FE2008AF NSA MaKe, tee EA m AE Sill Google 
公司 时 被 要 求 做 一 个 即兴 分 析 。Google 的 首席 执行 官 埃 里 克 : 施 密 特 问 
他 “给 100 万 个 32 位 整数 排序 的 最 高 效 算法 ”是 什么 。 奥 巴 马 显然 被 提示 
了 ， 因 为 他 马上 回答 , “我 觉得 冒 泡 排序 可 能 是 错误 的 做 法 ”。 参 见 
http://bit.ly/IMpIwTf. 




















ZERK: 冒 泡 排 序 在 概念 上 很 简单 ， 但 对 于 大 数据 量 的 排序 很 
慢 。 施 密 特 想得到 的 答案 可 能 是 “基数 排 


Fe” Chttp://en.wikipedia.org/wiki/Radix_sort) [1 。 





算法 分 析 的 目标 是 在 不 同 算法 间 做 出 有 意义 的 比较 ， 但 也 有 一 些 问 


。 算法 的 相对 性 能 可 能 依赖 于 人 硬件 的 特征 ， 所 以 一 个 算法 可 能 在 机 器 
A 上 更 快 ， 男 一 个 在 机 器 B 上 更 快 。 这 个 问题 的 通用 解决 方法 是 先 
指定 一 个 机 器 模型 ， 并 分 析 在 一 个 指定 的 机 需 模 型 中 一 个 算法 需 
要 执行 的 步 又 或 操作 。 
相对 性 能 还 可 能 依赖 于 数据 集 的 细节 特征 。 例 如 ， 有 的 排序 算法 在 
数据 已 经 是 部 分 排序 的 情形 下 比 其 他 算法 更 快 ， 有 的 程序 在 这 种 情 
况 下 反而 慢 。 避 免 这 个 问题 的 通常 办 法 是 分 析 最 坏 情况 场景 。 有 
时 候 分 析 平 均 情况 的 性 能 也 有 用 ， 但 也 通常 会 更 难 ， 因 为 有 哪些 情 
形 可 以 用 来 “平均 ”往往 并 不 明显 。 
相对 性 能 也 依赖 于 问题 的 规模 。 对 小 序列 更 快 的 排序 算法 可 能 对 大 
序列 束 慢 了 。 这 个 问题 的 通常 解决 方案 是 用 一 个 问题 规模 的 函数 来 
oe 











表达 运行 时 间 (或 操作 数 ) ， 并 根据 问题 规模 增 大 的 速度 将 函数 进 
行 归 类 。 





这 种 比较 的 好 处 之 一 是 自然 而 然 地 可 以 将 算法 进行 简单 地 分 类 。 例 
如 ， 如 果 我 知道 算法 A 的 运行 时 间 趋 回 于 和 输入 的 规模 n 成 比例 ， 而 算 
法 B 趋 向 于 和 n “成 比例 ， 那 么 我 会 预期 至 少 对 于 大 的 n 值 ， 算 法 A 比 算 
法 B 快 。 


这 种 分 析 也 有 需要 注意 的 地 方 ， 后 面 会 谈 到 。 


21.1 是 


假设 你 需要 分 析 两 个 算法 ， 并 依照 输入 的 规模 来 表达 它们 的 运行 时 
间 : 算法 A 需要 100n +1 步 来 解决 规模 为 n 的 问题 ， 算 法 B 需 要 n“+n+1 


tE 
ZV o 





下 面 的 表格 显示 了 这 两 个 算法 在 不 同 的 问题 规模 下 的 运行 时 间 : 


输入 规模 算法 A 的 运行 时 间 算法 B 的 运行 时 间 


1 000 100 001 1001 001 


En =10 时 ， 算 法 A 看 起 来 很 差 ， 它 几乎 需要 10 倍 于 算法 B 的 时 间 。 
但 对 于 n =100 来 说 它们 就 已 经 差不多 了 ， 而 在 更 大 的 规模 时 ， 算 法 A 远 
好 于 算法 B。 

















这 里 根本 的 原因 在 于 对 很 大 的 n 值 ， 任 何 包含 %“ 项 的 函数 都 会 比 首 
项 是 n 的 函数 增长 快速 很 多 。 首 项 是 一 个 多 项 式 中 最 高 次 方 的 项 。 








对 于 算法 A， 首 项 有 一 个 很 大 的 系数 100， 因 此 算法 B 在 小 的 n 时 比 
算法 A 快 。 但 不 论 系数 是 多 少 ， 总 有 一 个 m 值 会 导致 an “> bn 。 








对 于 非 首 项 来 说 也 如 此 。 即 使 算法 A 的 运行 时 间 是 n +1000000， 对 
于 足够 大 的 n ， 仍 然 会 比 算法 B 快 。 





总 的 来 说 ， 我 们 预期 有 更 小 的 首 项 的 算法 对 大 规模 问题 来 说 是 更 好 
的 算法 。 但 对 于 小 一 些 的 问题 来 说 ， 可 能 存在 一 个 交叉 点 ， 那 里 其 他 
算法 可 能 更 好 。 区 叉 点 的 位 置 取决 于 算法 的 细节 、 输 入 以 及 硬件 的 条 
件 ， 所 以 在 算法 分 析 时 第 种 被 忽略 择 。 但 那 并 不 意味 着 你 可 以 未 记 它 。 





如 果 两 个 算法 有 相同 的 首 项 ， 则 很 难说 哪 一 个 更 好 ;同样 地 ， 答 案 
也 取决 于 细 市 条 件 。 所 以 对 于 算法 分 析 来 说 ， 首 项 相同 的 函数 被 认为 是 
同等 的 ， 即 使 它们 的 系数 不 同 。 





增长 量 级 就 是 各 种 增长 行为 被 认为 是 同等 的 函数 的 集合 。 例 如 ， 
2n 、100n 和 n +l 都 是 一 个 增长 量 级 ， 用 大 0 标记 法 写作 O (n )， 通 常 称 
为 线性 的 ， 因 为 这 个 集合 中 的 每 个 函数 都 依据 n 线性 增长 。 


所 有 首 项 是 n“ 的 函数 都 属于 O (n“)， 它 们 被 称 为 是 平方 的 。 





下 面 的 表格 显示 了 算法 分 析 中 大 部 分 最 第 见 的 增长 量 级 ， 按 照 更 坏 
的 程度 递增 ; 











O (log , 7) 对 数 级 〈 对 任意 5 ) 


O(n?) 立方 级 


O(c") 指数 级 《底数 c 任意 ) 


对 于 对 数 项 ， 后 数 并 没有 影响 ， 修 改 瓜 数 相当 于 乘 以 一 个 闸 量 ， 而 
那样 并 不 影响 增长 量 级 。 类 似 地 ， 所 有 的 指数 函数 都 古 同一 个 增长 量 
级 ， 不 论 指数 的 底数 是 什么 。 指 数 函 数 增 长 非常 迅速 ， 所 以 指数 级 算法 
只 在 小 规模 问题 中 应 用 。 





练习 21-1 

在 http:Wen.wikipedia.org/wiki/Big_O_notation 上 阅读 大 0 标记 法 的 维 
基 百 科 页 面 ， 并 回答 下 列 问题 。 

1. n3+n? 的 增长 量 级 是 多 少 ? 1000000n ? +n? H? n? + 1000000: 
呢 ? 

2. (n“+n)-(n+1) 的 增长 量 级 是 多 少 ? 在 相 乘 之 前 ， 请 记 住 你 只 需 
要 首 项 。 


理 : 
EE 


说 ， 


3. WRF 是 O (9 )， 对 于 未 指定 的 函数 g ， 我 们 怎么 说 af +b ? 
4. 如 果 f Mfo 都 是 O (g )， 那 么 fj +f. Me? 
5. WR, 是 O (g Jf 是 O (h )， 那 么 fj +f. W? 


6. 如 果 f1 是 O (g Jif Æ0 (h), Afi fo W? 





关心 程序 性 能 的 程序 员 第 种 会 觉得 这 种 分 析 很 难 理解 。 他 们 有 道 
有 时 候 系 数 和 非 首 项 也 能 带 来 不 同 。 有 时 候 人 硬件 的 细 市 、 编 程 语 
以 及 输入 的 特征 ， 都 能 带 来 很 大 的 区 别 。 并 且 对 于 小 规模 问题 来 
渐进 行为 是 无 关 要 紧 的 。 














但 如 果 在 脑 中 记者 这 些 需 要 注意 的 要 点 的 话 ， 算 法 分 析 毕 竟 是 一 个 


有 用 的 工具 。 人 至 少 对 于 大 规模 问题 来 说 , “更 好 ”的 算法 往往 确实 更 好 ， 
并 且 有 时 候 它 会 好 得 多 。 两 个 增长 量 级 相同 的 算法 的 区 别 往往 是 一 个 
常量 值 ， 但 一 个 好 算法 和 一 个 坏 算 法 的 差距 是 没有 界限 的 ! 


21.2 ”Python 基本 操作 的 分 析 


在 Python 中 ， 大 部 分 算术 操作 都 是 常量 时 间 的 ;乘法 通 疝 比 加 法 和 
减法 花费 更 多 时 间 ， 而 除法 花费 的 更 多 ， 但 这 些 操作 的 时 间 与 参数 的 大 
小 无 天。 特别 大 的 整数 是 一 个 例外 ， 在 那 种 情况 下 ， 运 行 时 间 随 着 数字 
的 位 数 增加 而 增加 。 








索引 操作 一 一 在 序列 或 字典 中 读 写 元 系 一 一 也 是 常量 时 间 的 ， 与 数 
据 结构 的 规模 无 关 。 


志 历 一 个 序列 或 字典 的 for 循环 通 间 是 线性 的 ， 只 要 循环 体内 的 操 
作 本 身 是 间 量 级 。 例 如 ， 将 一 个 列表 的 元 素 相 加 古 线性 的 : 


total = 6 
for x int: 


total += x 








内 置 函 数 sum 也 是 线性 的 ， 因 为 它 做 相同 的 事情 。 但 它 趋 向 于 更 快 
些 ， 因 为 实现 得 更 高 效 ， 用 算法 分 析 的 语言 来 说， 就 是 它 有 一 个 更 小 的 
首 项 系数 。 





作为 一 个 经 验 规则， 如 果 循 环 体 的 增长 量 级 是 O (na ) 则 整个 循环 
FEO (ne *! )。 例 外 情况 是 当 你 能 够 证 明 循 环 在 一 个 常量 数 的 迭代 之 后 就 
能 退出 。 如 果 不 论 n 是 多 少 ， 循 环 只 最 多 运行 k 次 ， 则 即使 对 很 大 的 k 来 
说 ， 整 个 循环 的 增长 量 级 还 是 O (n? )。 


乘 以 K 并 不 会 改变 增长 量 级 ， 而 除法 也 不 会 。 所 以 ， 如 果 一 个 循环 
体 的 增长 量 级 是 O (nt), AA EIST Wk 次 ， 即 使 对 很 大 的 K 来 说 ， 整 个 
循环 的 增长 量 级 也 仍然 是 O (n? 二 )。 





大 部 分 字符 串 和 元 组 操作 都 是 线性 的 ， 只 有 下 标 访 问 和 len 函数 例 
外 ， 它 们 是 常量 级 时 间 的 。 内 置 函 数 min 和 max 是 线性 的 。 切 片 操作 的 
运行 时 间 与 输出 的 长 度 成 正比 ， 而 与 输入 的 长 度 无 关 。 








字符 串 拼 接 是 线性 的 ， 它 的 运行 时 间 与 操作 数 的 长 上 度 的 总 和 有 关 。 


所 有 的 字符 串 方 法 都 是 线性 的 ， 但 如 果 字 符 串 的 长 度 受 限 于 一 个 第 
量 〈 例 如 ， 在 只 有 一 个 字符 的 字符 串 的 操作 ， ， 可 以 看 作 是 当量 的 。 字 
符 串 方法 join 是 线性 的 ， 它 的 运行 时 间 与 字符 串 的 总 长 度 有 关 。 


大 多 数列 表 方 法 是 线性 的 ， 但 也 有 一 些 例外 。 











。 在 列表 结尾 处 添加 一 个 元 素 的 操作 平均 来 说 是 常量 时 间 的 ， 当 它 空 
间 不 足 时 ， 侦 尔 会 复制 到 男 一 个 更 大 的 地 方 ， 但 总 的 n 次 操作 的 时 
间 量 级 是 O (n )， 所 以 每 次 操作 的 平均 时 间 是 O (1)。 

© 从 列表 结尾 删除 一 个 元 素 的 操作 是 常量 时 间 的 。 

。 排序 的 量 级 是 O (n logn )。 


大 部 分 字典 操作 和 方法 都 是 常量 时 间 的 ， 但 也 有 一 些 例外 。 


e update 的 运行 时 间 和 作为 参数 传 入 的 字典 的 大 小 成 比例 ， 而 不 是 
被 更 新 的 字典 本 身 。 

e keys, values 和 items 都 是 常量 时 间 ， 因 为 它们 返回 的 是 达 代 
器 。 但 是 ， 如 果 循 环 裔 历 这 个 迭代 器 ， 则 循环 是 线性 的 。 





字典 的 效率 是 计算 机 科学 的 一 个 小 奇迹 。 我 们 会 在 21.4 市 中 介绍 它 
是 如 何 工作 的 。 


练习 21-2 


在 http:/en.wikipedia.org/wiki/Sorting_algorithm 阅 读 排序 算法 的 维基 
百科 页 面 并 回答 下 列 问 题 。 








1. 什么 是 “比较 排序 ? 比较 排序 的 最 坏 情况 的 增长 量 级 最 好 是 什 
A? 任何 排序 算法 中 ， 最 坏 情 况 的 增长 量 级 最 好 是 多 少 ? 











2， 冒 泡 排序 的 增长 量 级 是 多 少 ? 为 什么 奥巴马 认为 它 是 “错误 的 做 
法 ”? 


3. 基数 排序 的 增长 量 级 是 多 少 ? 要 使 用 它 ， 我 们 需要 哪些 前 置 条 











4. 稳定 排序 是 什么 ， 为 什么 在 实践 中 它 很 重要 ? 
5. 最 差 的 《有 名 字 的 ) 排序 算法 是 什么 ? 


6. C 语 言 库 里 用 的 排序 算法 是 什么 ? Python 里 用 的 是 什么 ? 这 些 算 
法 稳定 吗 ? 你 可 能 需要 去 Google 搜 索 这 些 答案 。 





7. 很 多 非 比 较 排 序 都 是 线性 的 ， 那 么 为 什么 Python 会 使 用 O (n logn 
) 的 比较 排序 呢 ? 


21.3 #RRIEN AM 


搜索 是 一 种 算法 ， 接 收 一 个 集合 和 一 个 目标 元 素 ， 并 决定 这 个 元 
素 是 人 否 在 集合 中 ， 通 第 返回 元 系 的 索引 。 








最 简单 的 搜索 算法 是 “线性 搜索 *， 即 按 顺序 过 历 集 合 的 每 一 个 元 
素 ， 直 到 找到 目标 元 素 为 止 。 在 最 坏 的 情况 下 ， 它 会 遇 历 整个 集合 ， 所 
以 运行 时 间 是 线性 的 。 


序列 的 in 操作 符 使 用 一 个 线性 搜索 ， 字 符 串 方 法 find 和 count 也 


如 果 序 列 中 的 元 素 是 排 好 序 的 ， 可 以 使 用 二 分 碍 找 ， 它 的 增长 量 
级 是 O (log n )。 二 分 查找 和 在 字典 (真实 的 字典 ， 而 不 是 那个 数据 结 
H) 中 全 找 单词 的 算法 类 似 。 不 像 普通 搜索 那样 从 第 一 个 元 素 开 始 ， 它 
是 从 序列 的 中 间 开 始 ， 检 查 要 但 找 的 词 是 在 中 间 的 元 系 之 前 还 是 之 后 。 
如 果 在 之 前 ， 则 继续 查找 序列 的 前 半 段 ， 否 则 查找 后 半 段 。 不 论 哪 种 情 
况 ， 都 可 以 将 碍 找 的 数量 减少 一 半 。 


如 果 序 列 有 1 000 000 个 元 素 ， 大 概 需 要 花 20 个 步骤 找到 单词 或 者 发 
现 它 不 存在 。 所 以 那样 会 比 线性 查找 快 大 概 50 000 倍 。 


二 分 查找 可 以 比 线性 碍 找 快 很 多 ， 但 需要 序列 本 身 是 排 好 序 的， 也 
就 需要 一 些 额外 工作 。 


有 男 一 个 数据 结构 ， 称 为 散 列 表 (hashtable) ， 它 甚至 更 快 一 一 它 





可 以 用 常量 时 间 来 搜索 一 一 而 且 不 需要 元 素 是 排 好 序 的 。Python 字 — 典 是 
使 用 散 列 表 实 现 的 ， 因 此 大 部 分 字典 操作 ， 包 括 in 操作 符 ， 都 是 常量 
时 间 的 。 


21.4 I 


为 了 解释 散 列 表 的 工作 机 制 以 及 为 何 它 的 效率 如 此 好 ， 我 们 先 从 一 
个 简单 的 映射 实现 开始 ， 并 逐步 改善 它 ， 直 到 成 为 一 个 散 列 表 。 





我 使 用 Python 来 展示 这 些 实现 。 但 真实 世界 中 ， 你 不 需要 用 Python 
写 这 样 的 代码 ， 你 只 需要 和 直接 使 用 字典 即 可 ! 所 以 本 章 中 剩 下 的 部 分 ， 
你 需要 想象 字典 并 不 存在 ， 而 你 需要 实现 一 个 数据 结构 将 键 映射 到 值 。 


K Ti 
你 需要 实现 的 操作 有 以 下 几 个 。 





add(k, v) 

添加 一 个 新 项 ， 将 键 k 映射 到 值 v 。 在 Python 字典 d 中 ， 这 个 操作 
写作 d[k] = v 。 

get(k) 

根据 键 k 查找 对 应 的 值 。 在 Python 字典 d 中 ， 这 个 操作 写作 d[k] 
或 d.get(k) 。 


就 现在 来 说， 我 假设 每 个 键 只 出 现 一 次 。 最 简单 的 实现 是 使 用 一 个 





元 组 列表 ， 每 个 元 组 是 一 个 键 值 对 : 





class LinearMap: 


def init_ _(self): 


self.items = [] 


def add(self, k, v): 
self.items.append((k, v)) 


def get(self, k): 
for key, val in self.items: 
if key == 
return val 
raise KeyError 





add 往 元 组 列表 中 添加 一 项 ， 这 个 操作 是 常量 时 间 的 。 


get 使 用 一 个 for 循环 来 搜索 列表 : 如 有 果 找 到 了 目标 键 ， 则 返回 对 
应 的 值 ， 否 则 抛 出 KeyError 。 所 以 get 是 线性 的 。 


另 一 个 方案 是 让 列表 按照 键 来 排序 。 这 样 get WERT DAE AY op 
找 ， 其 增长 量 级 是 O (logn )。 但 插入 一 个 新 项 到 列表 中 间 是 线性 的 ， 所 
以 这 可 能 也 不 是 最 好 的 选择 。 也 有 数据 结构 可 以 用 对 数 时 间 实 现 add 和 
get ， 但 那 仍然 没有 凋 量 时 间 好 ， 所 以 我 们 继续 。 





改善 LinearMap 的 方法 之 一 是 将 键 值 对 的 列表 拆 分 成 更 小 的 列表 。 
下 面 是 一 个 称 为 BetterMap 的 实现 ， 它 是 一 个 包含 100 个 LinearMap 的 列 
表 。 我 们 接 下 来 会 看 到 ，get 的 增长 量 级 仍然 是 线性 的 ， 但 
是 BetterMap 离散 列表 更 近 了 一 步 。 





class BetterMap: 


def _ _init_ (self, n=100): 
self.maps = [] 
for i in range(n): 
self.maps.append(LinearMap() ) 
def find_map(self, k): 
index = hash(k) % len(self.maps) 


return self.maps[ index ] 


def add(self, k, v): 


m = self.find_map(k) 
m.add(k, v) 


def get(self, k): 
m = self.find_map(k) 
return m.get(k) 





_ init _ 创建 由 n 个 LinearMap 组 成 的 列表 。 


find_map 被 add 和 get 调用 ， 用 来 确定 用 哪个 映射 来 保存 新 项 ， 
或 者 到 哪个 映射 里 去 搜索 。 


find_map 使 用 了 内 置 函数 hash ， 它 接收 几乎 所 有 的 Python 对 象 ， 
并 返回 一 个 整数 。 这 个 实现 的 限制 之 一 是 它 只 对 可 散 列 的 键 类 型 可 用 。 
可 变 类 型 ， 如 列表 和 字典 ， 是 不 可 散 列 的 。 





两 个 认为 相等 的 可 散 列 对 象 会 返回 相同 的 散 列 值 ， 但 反 过 来 并 不 一 
定 是 真 : 两 个 具有 不 同 值 的 对 象 可 以 返回 相同 的 散 列 值 。 





find_map 使 用 求 余 操作 E ea ain 
的 范围 中 ， 这 样 结果 是 列表 的 一 个 合法 索引 。 当 然 ， 这 意味 着 很 多 不 同 
的 散 列 值 会 封装 到 同一 个 索引 上 。 数 将 对 象 分 配 地 很 均匀 


《这 也 是 散 列 函数 设计 的 目标 ) ， 那 么 我 们 预计 每 个 LinearMap 有 m /100 
个 项 。 





因为 LinearMap .get 的 运行 时 间 是 和 其 包含 的 项 数 成 比例 的 ， 所 
以 我 们 预计 BetterMap 会 比 LinearMap 快 100 倍 。 增 长 量 级 仍然 是 线性 ， 
但 首 项 系数 更 小 。 这 很 好 ， 但 仍然 不 如 散 列 表 好 。 


Pil (AP) 是 让 散 列 表 能 变 快 的 关键 原因 : 如 有 果 你 能 保证 
LinearMap 的 长 度 有 限 ，LinearMap.get 则 会 是 常量 时 间 。 你 需要 做 的 
只 是 记录 元 素 的 总 数 ， 并 当 每 个 LinearMap 的 大 小 超过 一 个 浆 值 时 ， 重 
新 划分 散 列 表 ， 添 加 更 多 的 LinearMap。 








下 面 是 一 个 散 列 表 的 实现 : 


class HashMap: 


def init _(self): 
self.maps = BetterMap(2) 
self.num = @ 


def get(self, k): 
return self.maps.get(k) 


def add(self, k, v): 
if self.num == len(self.maps.maps): 
self.resize() 


self.maps.add(k, v) 
self.num += 1 


def resize(self): 
new_maps = BetterMap(self.num * 2) 


for m in self.maps.maps: 
for k, v in m.items: 
new_maps.add(k, v) 


self.maps = new_maps 





每 个 HashMap 都 包含 一 个 BetterMap; _ init _ 从 2 个 LinearMap 
开始 ， 并 初始 化 num ， 它 会 用 来 记录 总 的 项 数 。 








get 只 需要 分 配 到 对 应 的 BetterMap 。 真 正 的 工作 都 发 生 在 add 


中 ， 它 会 检查 项 数 和 BetterMap 的 大 小 如 果 相 等 ， 那 么 每 个 
LinearMap 的 平均 项 数 是 1， 所 以 它 调用 resize 。 








resize 创建 一 个 新 的 BetterMap ， 比 之 前 大 一 倍 ， 并 将 旧 有 的 映 
射 中 的 项 “重新 散 列 * 到 新 的 映射 中 。 


重新 散 列 是 有 必要 的 ， 因 为 LinearMap 的 数量 的 改变 ， 导 致 
find_map 的 求 余 操作 符 的 分 母 改变 。 也 就 是 说 ， 有 些 原先 会 散 列 到 同 
一 个 LinearMap 的 项 会 分 配 到 不 同 的 LinearMap 中 〈 这 也 是 我 们 想 要 的 ， 
WHE rng 





重新 散 列 是 线性 的 ， 所 以 resize 是 线性 的 ， 看 起 来 可 能 不 好 ， 因 
为 我 保证 过 add 应 当 是 常量 时 间 的 。 但 请 记得 我 们 并 不 是 每 次 都 需要 进 
行 resize ， 所 以 add 通常 是 常量 时 间 的 ， 只 是 侦 尔 会 线性 。add 运行 n 
次 的 总 时 间 是 和 n 成 比例 的 ， 因 此 每 次 调用 add 的 平均 时 间 是 常量 时 
间 ! 











要 明白 散 列 表 如 何 工 作 ， 考 虑 从 一 个 空 的 HashTable 开 始 ， 并 添加 
一 些 项 。 我 们 从 2 个 LinearMap 开 始 ， 所 以 最 开始 两 个 add 会 很 快 〈 不 需 
要 resize ) 。 我 们 说 它们 每 次 花费 一 单位 的 工作 量 。 下 一 个 add 会 需 
要 resize ， 所 以 我 们 需要 重新 散 列 前 两 项 (我 们 说 这 需要 再 加 2 个 单位 
的 工作 量 〉 并 添加 一 个 新 项 (再 加 1 个 单位 ，。 表 添加 一 项 花费 1 单位 ， 
所 以 至 今 为 止 是 4 项 花费 了 6 个 单位 的 工作 。 


下 一 个 add 需要 5 个 单位 ， 但 接着 的 3 个 都 只 需要 1 个 单位 ， 所 以 总 
共 是 8 项 花费 了 14 单 位 。 


再 下 一 个 add 需要 9 个 单位 ， 但 接着 我 们 可 以 在 再 次 resize 之 前 添 
加 7 项 ， 所 以 总 共 是 16 个 add 花费 了 30 单 位 。 


在 32 个 add 时 ， 总 共 的 花费 是 62 单 位 ， 而 我 希望 你 已 经 开始 看 到 其 
中 的 模式 了 。 在 n 个 add 之 后 ， 假 设 n 是 2 的 乘 方 ， 总 的 花费 是 2n -2 单 
位 ， 所 以 平均 每 个 add 的 工作 量 是 稍微 小 于 2 个 单位 的 。 当 n 是 2 的 乘 方 
时 ， 这 是 最 好 情况 ， 对 于 其 他 的 n 值 ， 平 均 工 作 量 稍 高 一 点 ， 但 这 并 不 
重要 。 重 要 的 是 这 是 O (1). 








图 21-1 用 图 形 化 的 方式 展示 了 这 个 过 程 。 每 个 方块 代表 一 个 单位 的 
工作 量 。 Re 
单位 ， 第 三 个 花费 3 单位 ， 


oH LLILLLLLLLLLLLILI 
[和 hae Ghee BER 
图 21-1 散 列 表 add 的 消耗 





多 余 的 重新 散 列 的 工作 看 起 来 像 一 序列 不 断 增高 的 塔 ， 之 间 的 间 陋 
越 来 越 远 。 现 在 如 果 你 将 塔 推倒 ， 将 resize 的 花费 均 挫 到 所 有 add 操 
作 上 ， 就 会 发 现 n 个 add 之 后 总 的 花费 是 2n -2。 


这 个 算法 的 一 个 重要 特点 是 当 我 们 调整 HashTable 的 大 小 时 ， 它 会 
几何 增长 ， 也 就 是 ， 我 们 乘 以 一 个 常量 到 大 小 上 。 如 果 算 术 地 增加 大 小 
么 每 个 add 的 平均 时 间 是 线性 的 。 











可 以 从 http:Wthinkpython2.com/code/Map.py 下 载 我 的 HashMap 实 现 ， 
但 请 记 住 并 没有 使 用 它 的 理由 。 如 采 需 要 一 个 映射 ， 直 接 用 Python 字典 
BPEJ. 
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算法 分 析 (analysis of algorithms) : 通过 对 比 运行 时 间 以 及 /或 者 





空间 需求 来 对 比 算法 的 方法 。 


机 器 模型 (machine model) : 用 于 描述 算法 的 简化 的 计算 机 表示 
FET 





最 坏 情 况 (worst case) : 让 指定 算法 运行 最 慢 《〈 或 者 需要 最 多 至 
间 的 ) 的 输入 。 





首 项 (leading term) : 在 多 项 式 中 ， 指 数 最 高 的 项 。 








交叉 点 Ccrossover point) : 两 个 算法 需要 相同 的 运行 时 间或 空间 
的 问题 规模 。 

增长 量 级 Corder of growth) : a 如 果 我 们 认为 一 组 
函数 的 增长 速度 可 以 看 作 相 等 ， 则 将 这 组 函数 称 为 同一 个 增长 量 级 的 。 
例如 ， 所 有 线性 增长 的 函 ee 


大 0 表示 法 (Big-Oh notation) : 表达 增长 量 级 的 方法 。 例 如 ，O 
(n ) 表 示 所 有 线性 增长 的 函数 集合 。 








线性 Clinear) : 运行 时 间 和 问题 规模 (至 少 对 于 大 规模 来 说 ) 成 
正比 的 算法 。 


平方 量 级 (quadratic) : 运行 时 间 和 n“ 成 正比 的 算法 ， 其 中 n 指 的 


征 问 题 规 模 。 





搜索 (search) : 定位 集合 (如 列表 或 字典 ) 中 某 个 元 素 或 者 判定 
它 不 在 其 中 的 问题 。 


散 列 表 (hashtable〉: 一 种 表示 键 值 对 集合 且 搜索 是 币 量 级 的 数据 
结构 。 


[1] 但 如 条 你 在 面试 时 被 问 到 这 个 问题 ， 我 觉得 更 好 的 答案 是 : “给 100 
万 个 数 排序 的 最 快 算法 应 当 是 使 用 我 用 的 语言 提供 的 排序 函数 。 它 的 性 
能 应 当 对 绝 大 多 数 应 用 都 足够 好 了 ， 但 如 果 发 现 我 的 程序 太 慢 ， 我 会 使 
用 一 个 性 能 分 析 器 去 碍 看 时 间 花 在 哪里 。 如 果 看 起 来 更 快 的 排序 算法 会 
币 来 明显 的 提升 ， 那 我 会 去 寻找 一 个 基数 排序 的 民 好 实现 。” 








译 后 记 





《 像 计算 机 科学 家 一 样 思考 》 这 一 系列 书 ， 早 有 耳闻 ， 和 它 可 谓 开 创 
了 程序 设计 入 门 书 的 一 个 新 思路 。 授 人 以 鱼 ， 不 在 授 人 以 渔 : 教 人 编 
程 ， 不 如 引导 人 思考 ; ARS, NTH St. MA 
Python 语言 之 后 ， 得 到 的 《 像 计 算 机 科学 家 一 样 思考 Python》 这 本 书 ， 
则 是 在 这 个 思路 上 走 到 了 一 个 极致 的 佳作 。 








我 是 工作 之 后 才 开 始 接触 Python 的 。 在 那 之 前 一 直 使 用 C/C++、 
Java、C# 等 传统 风格 的 语言 ， 再 看 到 Python， 不 免 有 耳目 一 新 之 感 。 为 
何以 往 觉 得 星 深 难 懂 的 程序 设计 理念 ， 在 Python 中 却 表达 得 这 么 简洁 易 
E? 为 何以 往 需 要 绞 尺 脑汁 才能 拼 出 来 的 大 段 代 码 ， 在 Python 里 却 只 需 
要 几 个 简单 调用 即 可 ?为何 繁 复 的 集合 操作 ， 在 Python 中 却 只 需要 一 行 
列表 理解 循环 语句 就 完成 了 ? 为 何 Python 的 文档 那么 容易 找 ， 还 可 以 使 
用 交互 模式 轻松 尝试 ? 每 次 使 用 Python 编写 程序 之 后 ， 总 会 感慨 ， 当 初 
初学 程序 设计 语言 的 时 候 ， 如 果 教 的 是 Python 该 多 好 。 相 信 所 有 学 过 
C/C++ 之 后 再 接触 Python 这 类 语言 的 人 ， 都 会 有 相同 的 感受 吧 。 





那么 是 什么 原因 让 C/C++ 几乎 芍 断 了 程序 设计 语言 的 教材 呢 ? 我 党 
得 更 多 的 是 历史 惯性 。 在 计算 机 科学 教育 开始 普及 的 20 世 纪 70、80 年 
代 ，C 语 言 正 在 其 易 盛 时 期 ， 几 乎 所 有 的 人 都 在 用 C 开 发 程序 ， 操 作 系 
统 、 软 件 、 游 戏 几 乎 都 是 用 C 甚 至 汇编 开发 的 。 人 硬件 性 能 的 限制 ， 让 那 
些 更 抽象 、 更 高 阶 的 语言 ， 无 法 普及 开 来 。 因 此 教学 目 然 也 使 用 它 。 久 
而 久之 形成 了 惯性 ， 到 了 新 世纪 ， 程 序 设 计 的 教学 已 经 赶不上 语言 发 展 





的 潮 沪 了。 我们 的 程序 越 来 越 复 杂 ， 越 来 越 像 人 脑 ， 而 教学 的 语言 仍然 
在 使 用 高 级 语言 中 最 贴近 机 器 的 C。 而 C++、Java、C#， 虽 然 相 对 于 C 更 
抽象 高 阶 ， 但 由 于 这 些 语言 设计 的 初衷 仍 是 以 扩展 C 为 主 ， 所 以 不 过 是 
在 这 一 惯性 上 多 走 了 五 十 步 而 已 。 





本 书 正 是 扭转 这 种 矛盾 局 面 的 一 个 有 益 的 尝试 。《 像 计算 机 科学 家 
一 样 思 考 》 是 对 程序 设计 教学 模式 的 真 详 的 领悟 ， 而 使 用 Python 这 种 简 
洁 强 大 的 高 阶 语 言 ， 也 正 是 这 种 新 思路 最 贴切 的 贯彻 。 授 人 以 渔 ， 自 然 
应 当 用 最 好 的 渔具 ， 引 导 人 思考 ， 当 然 也 应 使 用 更 贴近 人 的 思路 而 不 是 
机 器 思路 的 语言 。Python 在 高 阶 语言 中 ， 是 一 个 从 理念 和 实际 综合 考量 
后 非常 合适 的 候选 。 





在 翻译 过 程 中 我 发 现 ， 本 书 不 但 思路 很 贴切 其 教学 主 上 中， 从 行文 和 
用 例 来 看 也 非常 浅显 易 改 。 全 书 讲 了 非常 多 的 程序 设计 理念 ， 在 读 过 之 
后 却 会 觉得 那些 理念 都 很 自然 ， 大 概 也 是 因为 作者 匠心 安排 ， 前 后 穿 
插 ， 让 读者 能 循序 渐进 地 明白 每 个 程序 设计 理念 是 因为 什么 而 出 现 的 原 
因 吧 。 这 种 风格 ， 再 配合 上 精心 编辑 的 示例 ， 用 于 介绍 任何 程序 设计 语 
言 ， 都 是 非常 合适 的 。 











如 果 将 来 我 的 孩子 愿意 学 习 程 序 设计 ， 我 愿意 用 这 本 书 教 他 。 


这 一 版 ， 将 语言 升级 到 Python 3， 从 而 更 加 贴近 语言 发 展 的 趋势 。 
作者 对 章节 内 容 和 示例 练习 也 做 出 了 重新 组 织 和 调整 ， 使 得 阐述 行文 更 
加 通畅 。 








尽管 我 已 尽 最 大 努力 争取 译文 准确 、 完 善 ， 但 仍然 难免 有 下 漏 之 
处 ， 如 发 现 问题 ， 欢 迎 批评 指正 。 电 子 邮 箱 zhaopuming@gmail.com 。 


赵普 明 ”毕业 于 清华 大 学 计算 机 系 ， 从 事 软 件 开 发 行业 近 10 年 。 
从 2.3 版 本 开始 接触 Python， 工 作 中 使 用 Python 编写 脚本 程序 ， 用 于 快速 
原型 构建 以 及 日 志 计 算 等 日 党 作业 ; 业余 时 ， 作 为 一 个 编程 语言 爱好 
者 ， 对 D、Kotlin、Lua、Clojure、Scala、Julia、Go 等 语言 均 有 了 解 ， 但 
至 今 仍 为 Python 独特 的 风格 、 简 洁 的 设计 而 恢 叹 。 


VEST A 


Allen Downey 是 欧 林 工程 学 院 (Olin College of Engineering) 的 计 
算 机 科学 教授 。 他 曾 在 韦 尔 斯 利 学 院 (Wellesley College) 、 科 和 尔 比 学 
院 〈Colby College〉 和 加 州 大 学 伯克利 分 校 (U.C. Berkeley) 任教 。 他 
从 加 州 大 学 伯克利 分 校 获 得 计算 机 科学 博士 学 位 ， 并 从 MIT 获 得 人 硕士 和 
a a 


封面 介绍 


Ast Te BRASS, THUR SORA ees CZ 
Conuropsis carolinensis) . XPRS 45 FS ARE, JF AE Ph 
Ess Ba at DEA A eS, Ese de — RE BISA ALA AX, (AE 
要 分 布 在 佛罗里达 州 到 卡罗来纳 州 一 带 。 





卡罗来纳 鹦 融 主 色 是 绿色 ， 头 部 黄色 ， 成 熟 时 前 额 和 两 闫 会 出 现 一 
些 栖 红色 的 条 纹 。 它 的 平均 尺寸 是 31 一 33 cm. EMU TERM EK, FF 
且 在 捕食 过 程 中 会 叭 唆 不 体 。 它 居住 在 沼 译 与 河畔 的 树 洞 中 。 卡 多 来 纳 
鹦 下 是 喜欢 群居 的 生物 ， 平 时 以 小 群体 形式 生活 ， 在 捕食 时 可 以 达到 几 
AR. 





不 幸 的 是 ， 这 些 捕 食 过 程 往往 在 农田 的 庄稼 地 里 进行 ， 农 夫 会 射击 
它们 ， 以 免 破 坏 庄稼。 它们 的 群体 特性 让 它们 会 集体 救助 受伤 的 鹦鹉 ， 
结果 让 农夫 可 以 一 次 杀 光 整 群 鹦 璐 。 不 但 如 此 ， 它 们 的 羽毛 被 用 做 妇女 
的 帽 饰 ， 也 有 一 些 山 瑾 被 作为 宠物 。 这 些 因素 组 合 起 来 ， 导 致 在 19 世 纪 
晚期 ， 卡 罗 来 纳 鹦 瑾 变 得 非常 黎 少 ， 并 且 禽 类 疾病 也 加 剧 了 它们 的 减 
少 。 到 20 世 纪 20 年 代 ， 这 个 物种 灭绝 了 。 


今天 ， 全 世界 的 博物 馆 中 保存 了 700 多 只 卡罗来纳 鹦鹉 的 标本 。 


很 多 O?Reily 的 书 封面 上 的 动物 都 是 濒危 物种 ， 它 们 全 都 对 世界 有 
重要 意义 。 请 访问 animals.oreilly.com 来 了 解 如 何 帮助 它们 的 信息 。 


封面 图 片 来 自 《 约 戎 进 的 自然 历史 》 (Johnson’s Natural History 


欢迎 来 到 异步 社区 ! 


异步 社区 的 来 历 


异步 社区 (www.epubit.com.cn) 是 人 民 邮 电 出 版 社 旗 下 IT 专 业 图 书 旗 
舰 社 区 ， 于 2015 年 8 月 上 线 运营 。 


异步 社区 依托 于 人 民 邮 电 出 版 社 20 余 年 的 开 专 业 优 质 出 版 资源 和 编 
辑 策 划 团 队 ， 打 造 传统 出 版 与 电子 出 版 和 目 出 版 结合 、 纸 质 书 与 电子 书 
结合 、 传 统 印 刷 与 POD 按 需 印 刷 结合 的 出 版 平 合 ， 提 供 最 新 技术 资讯 ， 
为 作者 和 读者 打造 交流 互动 的 平台 。 
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ALD BEB AIT A ? 
购买 图 书 


我 们 出 版 的 图 书 涵盖 主流 IT 技 术 ， 在 编程 语言 、Web 搁 术 、 数 据 科 
学 等 领域 有 众多 经 典 畅销 图 书 。 社 区 现 已 上 线 图 书 1000 余 种 ， 电 子 书 
400 多 种 ， 部 分 新 书 实 现 纸 书 、 电 子 书 同步 出 版 。 我 们 还 会 定期 发 布 新 
书 书 讯 。 
下 载 资源 

社区 内 提供 随 书 附 赠 的 资源 ， 如 书 中 的 案例 或 程序 源 代码 。 





另外 ， 社 区 还 提供 了 大 量 的 免费 电子 书 ， 只 要 注册 成 为 社区 用 户 就 
可 以 免费 下 载 。 


与 作 译 者 互动 


很 多 图 书 的 作 译 者 已 经 入 驻 社区 ， 您 可 以 关注 他 们 ， 咨 询 技 术 问 
题 ， 可 以 阅读 不 断 更 新 的 技术 文章 ， 听 作 译 者 和 编辑 畅 聊 好 书 背 后 有 趣 
的 故事 ;， 还 可 以 参与 社区 的 作者 访谈 栏目 ， 疝 您 天 注 的 作者 提出 末 访 题 
Ho 








灵活 优惠 的 购书 


您 可 以 方便 地 下 单 购买 纸 质 图 书 或 电子 图 书 ， 纸 质 图 书 直 接 从 人 民 
邮电 出 版 社 书 库 发 贷 ， 电 子 书 提供 多 种 阅读 格式 。 

对 于 重 磅 新 书 ， 社 区 提供 预 售 和 新 书 首发 服务 ， 用 户 可 以 第 一 时 间 
买 到 心仪 的 新 书 。 


用 户 帐 户 中 的 积分 可 以 用 于 购书 优惠 。100 积 分 =1 元 ， 购 买 图 书 
时 ， 在 + Mm 里 填 入 可 使 用 的 积分 数值 ， 即 可 扣 减 相应 金额 。 


| Regains 


购买 本 电子 书 的 读者 专 享 异步 社区 优惠 券 。 使 用 方法 : 注册 成 为 社区 用 户 ， 在 下 单 购书 
时 输入 “57AWG”， 然 后 点 击 “ 使 用 优惠 码 ” 即 可 享受 电子 书 8 折 优 惠 ( 本 优惠 券 只 可 使 用 一 
次 ) 。 






































纸 电 图书 组 合 购买 


社区 独家 提供 纸 质 图 书 和 电子 书 组 合 购 买方 式 ， 价 格 优 惠 ， 一 次 购 
买 ， 多 种 阅读 选择 。 
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AX BT BUT A ? 
提交 勘误 
您 可 以 在 图 书页 面 下 方 提交 勘误 ， 每 条 勘误 被 确认 后 可 以 获得 100 
积分 。 热 心 勘误 的 读者 还 有 机 会 参与 书稿 的 审 校 和 翻译 工作 。 
写作 


社区 提供 基于 Markdown 的 写作 环境 ， 喜 欢 写作 的 您 可 以 在 此 一 试 
身手 ， 在 社区 里 分 享 您 的 技术 心得 和 读书 体会 ， 更 可 以 体验 上 自 出 版 的 乐 
趣 ， 轻 松 实现 出 版 的 梦想 。 











如 果 成 为 社区 认证 作 译 者 ， 还 可 以 享受 异步 社区 提供 的 作者 专 至 特 
色 服 务 。 


会 议 活 动 早 知 道 


您 可 以 掌握 1T 圈 的 技术 会 议 资讯 ， 更 有 机 会 免费 获 赠 大 会 门票 。 


AR 


扫描 任意 二 维 码 都 能 找到 我 们 : 








异步 社区 





微 信 订 阅 号 

















QQ: 436746675 


社区 网 址 : www.epubit.com.cn 
官方 微 信 : 异步 社区 
官方 微 博 : @ 人 邮 异 步 社区 ，@ 人 民 邮 电 出 版 社 -信息 技术 分 社 


投稿 改 咨询 : contact@epubit.com.cn 


